Решение цифровой разведки по компаниям
🧭 Интернет можно рассматривать как граф компаний, технологий и связей.
Я создал проект Adatari, который превращает миллионы доменов в структурированные данные о компаниях.
Пайплайн обогащения
- Collector — сбор доменов из открытых источников
- Deduplicator — устранение дубликатов и TTL-фильтрация
- DNS Resolver & Port Scanner — проверка доступности
- HTML Analyzer + LLM Classifier — извлечение и классификация содержимого
- PostgreSQL + ElasticSearch — хранение и быстрый поиск
Инновации
- Reactive Intelligence Grid — реактивная архитектура с обогащением в реальном времени
- Классификация по ISIC/ОКВЭД
- Геотаксономия на основе ISO 3166
- API-доступ с тарификацией
Практическая польза
- Бизнес-разведка по конкурентам и рынкам
- Поиск целевых клиентов по отрасли и региону
- Мониторинг изменений: новые сайты, смена хостинга, появление брендов