Постоянная эволюция для интеллектуального будущего AIoT: Dahua Technology представляет модели Xinghan Large-scale AI Model

IT
23 сентября 2025 21:21

Компания Dahua Technology, ведущий мировой поставщик решений и услуг AIoT, ориентированных на видео, официально запустила Xinghan Large-scale AI Models — систему искусственного интеллекта нового поколения, которая объединяет крупномасштабный визуальный интеллект с мультимодальными и языковыми возможностями. Разработанная для решения сложных задач в реальных условиях, система Xinghan представляет собой важный шаг вперед в непрерывных инновациях Dahua, расширяя возможности интеллектуальной трансформации в различных секторах.

The Dahua Xinghan Large-Scale AI Model places visual analysis at its core, integrating multimodal capabilities and embedding deep industry expertise to create a large model tailored for diverse application scenarios. Built upon this real-world foundation, it serves as the key to achieving scalable and commercially viable AI solutions.

Технологический фундамент Xinghan

С миссией, позволяющей машинам по-настоящему понимать мир, система модели Xinghan продолжает развиваться, соединяя передовые исследования с реальными приложениями. Названная в честь китайского слова «галактика», модель Xinghan предоставляет матрицу возможностей полного стека, основанную на синергии периферийного облака, обеспечивая масштабируемый адаптивный интеллект в разных отраслях. Модернизированная архитектура Xinghan включает в себя три основных модельных ряда: L, V и M. Модель L-серии фокусируется на понимании и взаимодействии естественного языка, в то время как две других занимаются более конкретными применениями:

Серия V: визуальные модели Xinghan

Эта серия, ориентированная на передовой визуальный интеллект и видеоаналитику, упрощает целевые категории, фокусируясь на ключевых целях (например, людях, автотранспортных средствах и немоторных транспортных средствах), чтобы уменьшить сложность модели при сохранении высокой точности.

К основным функциям относятся:

  • Защита периметра. Покрытие расширяется за счет точного определения целей меньшего размера (даже до 20×20 пикселей) по сравнению с традиционными моделями ИИ на основе CNN, уменьшения ложных тревог и увеличения дальности обнаружения камер больших моделей.*
  • WizTracking. Предлагает интеллектуальный алгоритм отслеживания следующего поколения, который может обрабатывать сложные окклюзии и изменения в целевой позе, достигая 50% повышения точности.
  • Краудмэппинг. Значительно улучшает обнаружение малых целей на больших расстояниях (до 2 раз дальше) и имеет зонтичную компенсацию, повышая точность на 80% в дождливую погоду*. Он также предлагает 2,5-кратное увеличение диапазона анализа, поддерживает обнаружение до 5000 человек и обеспечивает надежную производительность в плотных толпах и условиях низкой освещенности.*
  • Адаптивный сценарий — AI WDR. Использует ситуационную осведомленность для анализа как пространственных, так и контекстуальных характеристик места, обеспечивая интеллектуальную и автоматизированную конфигурацию камеры.
  • AI Rule Assist. Предназначен для автоматического разграничения правил вторжения защиты периметра, предлагая доступ в один клик, высокоточное распознавание места, автоматический анализ и многое другое.

Серия M: мультимодальные модели Xinghan

Мультимодальные модели — это передовые системы искусственного интеллекта, способные одновременно обрабатывать и глубоко интегрировать несколько разнородных типов данных (например, текст, изображения, аудио и видео). Это значительно повышает эффективность обработки информации, обеспечивает более естественное взаимодействие человека с компьютером и открывает более широкий спектр сценариев применения.

К основным функциям относятся:

  • WizSeek. Революционизирует исследование видео с помощью поиска на естественном языке. Просто опишите свою цель (например, людей, транспортное средство, животное или предмет и т. д.), и WizSeek мгновенно извлечет соответствующие кадры из записанных видеоархивов.
  • Сигналы, определяемые текстом . Позволяет пользователям определять аварийные сигналы, просто описывая их на естественном языке, что значительно снижает порог разработки и обеспечивает быструю, гибкую и масштабируемую конфигурацию, адаптированную к различным сценариям реального мира.