Записки команды о разработке, AI и продукте
Тексты от инженеров и дизайнеров nordiqdev. Без маркетинга, с цифрами с реальных проектов. О мобильной разработке, веб-сервисах, LLM-агентах, фреймворках и индустрии.
Llama 3 в self-hosted: когда это имеет экономический смысл
Open-source LLM от Meta стали реально конкурентоспособны. Считаем, на каких объёмах и сценариях self-hosted дешевле API, и какое железо берём.
Tool use в Claude: построили AI-агента для саппорта за 6 недель
Anthropic стабилизировала tool use весной. Мы взяли его в кейс реального саппорта SaaS - рассказываем, что пошло хорошо, что - не очень.
Мультимодальные модели для обработки документов: GPT-4o vs Claude 3.5 Sonnet
Раньше для извлечения данных из документов нужна была связка OCR + LLM. Сейчас это один вызов мультимодальной модели. Разбираем, когда это уже работает.
Голосовой AI в колл-центрах: что реально внедряется в 2024
Голосовые ассистенты на LLM перестали звучать как робот. Это меняет экономику колл-центров. Разбираем три внедрения и считаем юнит-экономику.
Эмбеддинги в 2024: OpenAI text-embedding-3, BGE, Jina, Cohere
OpenAI обновила линейку, появились сильные открытые модели, BGE и Jina выбили проприетарных лидеров. Что выбирать под конкретную задачу в 2024-м.
RAG в продакшне: грабли, на которые наступили на пяти проектах
Все строят RAG. Не все его доводят до прод-качества. Делимся пятью самыми болезненными проблемами и тем, как мы их решаем сейчас.
Claude 3 против GPT-4: сравнение для продакшн-задач
Anthropic выпустила семейство Claude 3 в марте. Прогнали все три модели против GPT-4 Turbo на наших боевых пайплайнах - делимся метриками без хайпа.