Принимаю проекты на Q3 2026

Внедряю AI там,
где это окупается.

Аудит готовности, разработка агентов и RAG-систем, голосовые ассистенты, компьютерное зрение для документов, интеграция LLM в существующие продукты. Senior-инженер с кейсами в продакшене.

2 место
Хакатон Сбера, AI-аналитика
Топ 10
BITGN Prompted Agent Challenge
200M+
строк под AI-аналитикой в проде
8 лет
в разработке, 3 года в AI
Работаю со стеком
OpenAI Anthropic Claude Whisper pyannote LangChain FastAPI Spring Boot PostgreSQL + pgvector Yandex Cloud
Услуги

Шесть направлений, в каждом — рабочие кейсы

Беру задачи end-to-end: от первого разговора и аудита до релиза и поддержки в проде. Без «давайте сначала проведём 6-месячное исследование».

AI-аудит и стратегия

Где AI даст реальный ROI, где сожжёт бюджет. Карта use-case'ов, оценка готовности данных, выбор стека и моделей, дорожная карта на 3–12 месяцев.

  • Аудит за 2 недели
  • Технический и бизнес-фокус
  • Конкретные next steps, а не PDF на полку

AI-агенты и tool-use

Агенты, которые реально решают задачи, а не «диалоговое демо». Tool-use, multi-step reasoning, recovery от ошибок, audit trail и контроль стоимости.

  • Claude / GPT-4-level reasoning
  • Tool-design, JSON-schema, retry-стратегии
  • Honest benchmarks (топ-10 в публичном bench)

RAG и корпоративные знания

Q&A по документам, базам знаний, регламентам. Правильный чанкинг, выбор embedder'а, метрики retrieval, защита от галлюцинаций.

  • pgvector / Qdrant / Chroma
  • Hybrid search (BM25 + dense)
  • Evaluation harness в комплекте

Голосовые ассистенты

STT → LLM → TTS пайплайны на проде. Whisper (облако или локально), диаризация спикеров, синтез речи. Кейсы в медицине, телефонии, кол-центрах.

  • Asterisk-интеграция, AGI-скрипты
  • faster-whisper, pyannote, ElevenLabs
  • Российские провайдеры (Yandex SpeechKit) как fallback

Vision и обработка документов

Claude Vision / GPT-4V для документов, чертежей, накладных. Гибридные пайплайны, где LLM работает только там, где нет детерминированной логики.

  • CAD/DXF + Vision для промышленности
  • Структурированный JSON-выход через Pydantic
  • Перекрёстная верификация результатов

Интеграция LLM в продукт

AI как часть существующего бэкенда — не отдельная демка. FastAPI / Spring Boot, очереди, контроль стоимости токенов, A/B тесты моделей, наблюдаемость.

  • Streaming, function calling, structured output
  • Защита от vendor-lock: 2+ провайдера
  • Метрики качества и стоимости в Grafana
Кейсы

Что я делал — публичные и обезличенные

Публичные проекты ссылаю напрямую. Кейсы под NDA — описаны категориями и техническими вызовами без раскрытия клиента.

Хакатон Сбера · 2-е место Java / Spring Boot 4 · Claude Sonnet 4

Pivot Copilot — AI-аналитика поверх 200M+ строк

За 24 часа собрал с командой (как тимлид) AI-аналитическую платформу с agent loop: Claude выбирает из 8 инструментов, Java детерминированно считает, Claude интерпретирует. Materialized views, тюнинг PostgreSQL, защита от дорогих high-cardinality запросов.

Spring Boot 4jOOQPostgreSQLReact 19Claude Sonnet 4Docker · Caddy
Открыть live demo →
BITGN Challenge · Топ-10 Python · GPT-4.1

Автономный агент в Prompted Agent Challenge

Автономный агент с 9 инструментами над виртуальной файловой системой. Многопоточное исполнение, типобезопасные tool-calls через Pydantic, итеративная доводка от v1 к v2.

Python 3.14OpenAI GPT-4.1Protocol BuffersConnectRPC
Код на GitHub →
Medtech · NDA Embedded + AI · Production

Носимое медицинское устройство с авто-расшифровкой приёма

End-to-end продукт: hardware (ESP32-S3 + BLE) → бэкенд (FastAPI + Celery) → AI-пайплайн (faster-whisper large-v3 + pyannote-audio + GPT-4o → структурированная медицинская запись). Защита от vendor-lock: переключение между провайдерами через конфиг.

ESP32-S3FastAPIPostgreSQLMinIOfaster-whisperpyannoteGPT-4o
Демо — по запросу под NDA
Промышленность · NDA Claude Vision + CAD

Анализ инженерных чертежей с гибридным пайплайном

Claude Vision как часть детерминированного пайплайна: парсинг DXF (ezdxf) + геометрия (Shapely, boolean ops) + LLM-fallback только там, где правил недостаточно. Golden-dataset тестирование, точность ±1 мм² на ключевых сценариях.

Claude VisionClaude HaikuezdxfShapelyPydantic v2
Кейс под NDA
Public · Telephony Asterisk + OpenAI

AI-кол-центр для клиники

Полная цепочка для входящего вызова: IVR → запись в WAV → Whisper → GPT-4o → TTS → проигрывание в трубку. Корректная работа с форматами SIP-телефонии (8 кГц mono).

Asterisk PBXPython AGIWhisperGPT-4oOpenAI TTSSoX
Код на GitHub →
Evaluation · NDA FastAPI · Qwen3.5

Evaluation harness для AI-агента

«Как мы поймём, что AI работает?» — болевая точка любого внедрения. Сделал фреймворк: 23 probe-сценария × 10 измерений качества, signal-checkers + LLM-as-judge, scoreboard версий промптов, HTML-отчёты, live-логи через SSE.

FastAPIasyncioQwen3.5GPT-4.1-miniSSE
Шаблон доступен под проект
Подход

Как мы будем работать

Никакого «AI ради AI» и шестимесячных исследований. Гипотеза → быстрый PoC → решение, делаем дальше или закрываем честно.

01

Discovery — 1 неделя

30–60 минутный разговор + изучение задачи. На выходе: 3–5 ранжированных use-case'ов с оценкой ROI, рисков и сложности. Бесплатно.

02

Аудит — 2 недели

Глубокий анализ выбранного направления: данные, инфраструктура, выбор моделей и стека, конкуренты, дорожная карта на 3–6 месяцев. Фикс-прайс, документ + презентация.

03

PoC — 3–4 недели

Рабочий прототип на реальных данных. Метрики качества и стоимости. Решаем go/no-go на основе цифр, а не ощущений.

04

Production — 1–3 месяца

MVP в проде с мониторингом, контролем стоимости и evaluation harness. Дальше — поддержка или передача команде клиента с документацией и обучением.

Обо мне

Инженер, а не «AI-евангелист»

Senior full-stack с 8-летним опытом, последние 3 года — в AI/LLM на проде. Прошёл путь от ML-курса ФКН ВШЭ до production-систем с агентами и кастомным STT-пайплайном на ESP32.

Не люблю красивые слайды без чисел. Люблю — когда заказчик говорит «теперь у нас всё работает» и присылает скриншот метрик. Не возьмусь за проект, где AI не нужен — честно скажу.

  • Стек: Python (FastAPI, async), Java (Spring Boot), TypeScript/React, Flutter, embedded (ESP32). Базы: PostgreSQL + pgvector, MongoDB, MinIO, Redis.
  • AI-провайдеры: OpenAI (GPT-4o/4.1, Whisper, TTS, Vision), Anthropic Claude (Sonnet, Haiku, Vision), Yandex Cloud (SpeechKit + LLM), локальные модели (faster-whisper, pyannote).
  • DevOps: Docker, Nginx, GitHub Actions CI/CD, мониторинг через Grafana/Netdata.
  • Языки: русский, английский (свободно — работаю с международными бенчмарками и SDK).

Достижения

  • 2 место на хакатоне Сбера по AI-аналитике
  • 10 место (топ-10) в BITGN Prompted Agent Challenge
  • 5+ production-систем с LLM в основном цикле
  • 25 репозиториев на GitHub, активная разработка
Свяжитесь

Расскажите о задаче — 30 минут бесплатно

Опишите ситуацию в свободной форме: что есть, чего хочется. В ответ — короткая оценка, нужно ли вам AI, и если да — как лучше подойти. Без обязательств.