Записки команды о разработке, AI и продукте
Тексты от инженеров и дизайнеров nordiqdev. Без маркетинга, с цифрами с реальных проектов. О мобильной разработке, веб-сервисах, LLM-агентах, фреймворках и индустрии.
Whisper в продакшне: как мы делаем голосового помощника
Whisper открыл большинству продуктов дверь к голосовым интерфейсам. Делимся реальной кухней - от выбора модели до борьбы с шумом метро.
Llama 2 и open-source LLM в продакшне: пробуем альтернативу OpenAI
Meta выложила Llama 2 в коммерческий доступ. Мы развернули её на одном из клиентов, где данные нельзя слать наружу. Делимся реальными числами.
pgvector vs Pinecone vs Qdrant: что выбрать для AI-приложения
Когда у клиента уже есть Postgres, тащить отдельную vector DB кажется лишним. Когда векторов миллионы - pgvector начинает захлёбываться. Разбираем границы.
LLM-агенты: первые попытки и громкие провалы
AutoGPT и BabyAGI взорвали Twitter весной. Мы попробовали агентный подход в трёх проектах. Расскажем, почему два из трёх свернули.
RAG-архитектура на практике: что выбрать в 2023 году
RAG - это не фреймворк и не библиотека. Это архитектурный паттерн, и сделать его правильно сложнее, чем кажется по туториалам.
GPT-4 вышла: что меняется для продуктов и команд
OpenAI выкатила GPT-4 14 марта. Через неделю у нас были первые замеры на реальных задачах. Делимся, где она оправдывает цену, а где нет.
ChatGPT API в продакшне: первые интеграции и грабли
OpenAI открыл API в марте, и к лету у нас уже три продукта на gpt-3.5. Делимся первыми граблями: латентность, стоимость и что происходит, когда модель уверенно врёт.