Журнал · с августа 2022

Записки команды о разработке, AI и продукте

Тексты от инженеров и дизайнеров nordiqdev. Без маркетинга, с цифрами с реальных проектов. О мобильной разработке, веб-сервисах, LLM-агентах, фреймворках и индустрии.

22 октября 2024

Llama 3 в self-hosted: когда это имеет экономический смысл

Open-source LLM от Meta стали реально конкурентоспособны. Считаем, на каких объёмах и сценариях self-hosted дешевле API, и какое железо берём.

Команда nordiqdev7 мин
10 сентября 2024

Tool use в Claude: построили AI-агента для саппорта за 6 недель

Anthropic стабилизировала tool use весной. Мы взяли его в кейс реального саппорта SaaS - рассказываем, что пошло хорошо, что - не очень.

Команда nordiqdev8 мин
29 июля 2024

Мультимодальные модели для обработки документов: GPT-4o vs Claude 3.5 Sonnet

Раньше для извлечения данных из документов нужна была связка OCR + LLM. Сейчас это один вызов мультимодальной модели. Разбираем, когда это уже работает.

Команда nordiqdev6 мин
11 июля 2024

Голосовой AI в колл-центрах: что реально внедряется в 2024

Голосовые ассистенты на LLM перестали звучать как робот. Это меняет экономику колл-центров. Разбираем три внедрения и считаем юнит-экономику.

Команда nordiqdev8 мин
22 мая 2024

Эмбеддинги в 2024: OpenAI text-embedding-3, BGE, Jina, Cohere

OpenAI обновила линейку, появились сильные открытые модели, BGE и Jina выбили проприетарных лидеров. Что выбирать под конкретную задачу в 2024-м.

Команда nordiqdev6 мин
9 апреля 2024

RAG в продакшне: грабли, на которые наступили на пяти проектах

Все строят RAG. Не все его доводят до прод-качества. Делимся пятью самыми болезненными проблемами и тем, как мы их решаем сейчас.

Команда nordiqdev8 мин
21 марта 2024

Claude 3 против GPT-4: сравнение для продакшн-задач

Anthropic выпустила семейство Claude 3 в марте. Прогнали все три модели против GPT-4 Turbo на наших боевых пайплайнах - делимся метриками без хайпа.

Команда nordiqdev8 мин