AI-консалтинг — аудит, разработка и внедрение AI-решений

Внедряю AI там,
где это окупается.

Аудит готовности, разработка агентов и RAG-систем, голосовые ассистенты, компьютерное зрение для документов, интеграция LLM в существующие продукты. Senior-инженер с кейсами в продакшене.

2 место

Хакатон Сбера, AI-аналитика

Топ 10

BITGN Prompted Agent Challenge

200M+

строк под AI-аналитикой в проде

8 лет

в разработке, 3 года в AI

Работаю со стеком

OpenAI Anthropic Claude Whisper pyannote LangChain FastAPI Spring Boot PostgreSQL + pgvector Yandex Cloud

Хакатон Сбера · 2-е место Java / Spring Boot 4 · Claude Sonnet 4

Pivot Copilot — AI-аналитика поверх 200M+ строк

За 24 часа собрал с командой (как тимлид) AI-аналитическую платформу с agent loop: Claude выбирает из 8 инструментов, Java детерминированно считает, Claude интерпретирует. Materialized views, тюнинг PostgreSQL, защита от дорогих high-cardinality запросов.

Spring Boot 4jOOQPostgreSQLReact 19Claude Sonnet 4Docker · Caddy

Открыть live demo →

BITGN Challenge · Топ-10 Python · GPT-4.1

Автономный агент в Prompted Agent Challenge

Автономный агент с 9 инструментами над виртуальной файловой системой. Многопоточное исполнение, типобезопасные tool-calls через Pydantic, итеративная доводка от v1 к v2.

Python 3.14OpenAI GPT-4.1Protocol BuffersConnectRPC

Код на GitHub →

Medtech · NDA Embedded + AI · Production

Носимое медицинское устройство с авто-расшифровкой приёма

End-to-end продукт: hardware (ESP32-S3 + BLE) → бэкенд (FastAPI + Celery) → AI-пайплайн (faster-whisper large-v3 + pyannote-audio + GPT-4o → структурированная медицинская запись). Защита от vendor-lock: переключение между провайдерами через конфиг.

ESP32-S3FastAPIPostgreSQLMinIOfaster-whisperpyannoteGPT-4o

Демо — по запросу под NDA

Промышленность · NDA Claude Vision + CAD

Анализ инженерных чертежей с гибридным пайплайном

Claude Vision как часть детерминированного пайплайна: парсинг DXF (ezdxf) + геометрия (Shapely, boolean ops) + LLM-fallback только там, где правил недостаточно. Golden-dataset тестирование, точность ±1 мм² на ключевых сценариях.

Claude VisionClaude HaikuezdxfShapelyPydantic v2

Кейс под NDA

Public · Telephony Asterisk + OpenAI

AI-кол-центр для клиники

Полная цепочка для входящего вызова: IVR → запись в WAV → Whisper → GPT-4o → TTS → проигрывание в трубку. Корректная работа с форматами SIP-телефонии (8 кГц mono).

Asterisk PBXPython AGIWhisperGPT-4oOpenAI TTSSoX

Код на GitHub →

Evaluation · NDA FastAPI · Qwen3.5

Evaluation harness для AI-агента

«Как мы поймём, что AI работает?» — болевая точка любого внедрения. Сделал фреймворк: 23 probe-сценария × 10 измерений качества, signal-checkers + LLM-as-judge, scoreboard версий промптов, HTML-отчёты, live-логи через SSE.

FastAPIasyncioQwen3.5GPT-4.1-miniSSE

Шаблон доступен под проект

Инженер, а не «AI-евангелист»

Senior full-stack с 8-летним опытом, последние 3 года — в AI/LLM на проде. Прошёл путь от ML-курса ФКН ВШЭ до production-систем с агентами и кастомным STT-пайплайном на ESP32.

Не люблю красивые слайды без чисел. Люблю — когда заказчик говорит «теперь у нас всё работает» и присылает скриншот метрик. Не возьмусь за проект, где AI не нужен — честно скажу.

Стек: Python (FastAPI, async), Java (Spring Boot), TypeScript/React, Flutter, embedded (ESP32). Базы: PostgreSQL + pgvector, MongoDB, MinIO, Redis.

AI-провайдеры: OpenAI (GPT-4o/4.1, Whisper, TTS, Vision), Anthropic Claude (Sonnet, Haiku, Vision), Yandex Cloud (SpeechKit + LLM), локальные модели (faster-whisper, pyannote).

DevOps: Docker, Nginx, GitHub Actions CI/CD, мониторинг через Grafana/Netdata.

Языки: русский, английский (свободно — работаю с международными бенчмарками и SDK).

Внедряю AI там,
где это окупается.

Шесть направлений, в каждом — рабочие кейсы

AI-аудит и стратегия

AI-агенты и tool-use

RAG и корпоративные знания

Голосовые ассистенты

Vision и обработка документов

Интеграция LLM в продукт

Что я делал — публичные и обезличенные

Pivot Copilot — AI-аналитика поверх 200M+ строк

Автономный агент в Prompted Agent Challenge

Носимое медицинское устройство с авто-расшифровкой приёма

Анализ инженерных чертежей с гибридным пайплайном

AI-кол-центр для клиники

Evaluation harness для AI-агента

Как мы будем работать

Discovery — 1 неделя

Аудит — 2 недели

PoC — 3–4 недели

Production — 1–3 месяца

Инженер, а не «AI-евангелист»

Достижения

Расскажите о задаче — 30 минут бесплатно

Внедряю AI там, где это окупается.

Шесть направлений, в каждом — рабочие кейсы

AI-аудит и стратегия

AI-агенты и tool-use

RAG и корпоративные знания

Голосовые ассистенты

Vision и обработка документов

Интеграция LLM в продукт

Что я делал — публичные и обезличенные

Pivot Copilot — AI-аналитика поверх 200M+ строк

Автономный агент в Prompted Agent Challenge

Носимое медицинское устройство с авто-расшифровкой приёма

Анализ инженерных чертежей с гибридным пайплайном

AI-кол-центр для клиники

Evaluation harness для AI-агента

Как мы будем работать

Discovery — 1 неделя

Аудит — 2 недели

PoC — 3–4 недели

Production — 1–3 месяца

Инженер, а не «AI-евангелист»

Достижения

Расскажите о задаче — 30 минут бесплатно

Внедряю AI там,
где это окупается.