Ukrainian military datasets goldmine

EN: What the “couch spetznaz” writes about is already happening, but this does not mean that it is becoming less relevant. Datasets are dealt with internally by anyone who needs them, and the US is also very interested, moreover, there is a special initiative that Ukrainian miltech startups receive funding in exchange for datasets.

But there are many nuances. Currently, everything is as usual – the wrong people are doing it, without the proper resources and powers. In order for the Ukrainian Oppenheimer of datasets to appear, the Ukrainian Leslie Groves of the engineering forces must appear, who must be assigned a task and allocated resources.

UA: Про що пише диванний спецназ вже відбувається, але це не значить що воно стає менш актуальним. Датасетами займаються і всередині кому потрібно, і також дуже цікавляться з боку US, ба більше існує спеціальна ініціатива що українськi miltech стартапи отримують фандінг в обмін на датасети.

Але є багато нюансів. Наразі все як звичайно – займаються цим не ті люди, без належних ресурсів та повноважень. Щоб з’явився українській Оппенгеймер датасетів має з’явитися український Леслі Гроувз інженерних військ якому має бути поставлена задача та виділені ресурси.

Quote (ru): Идея дня:

Сейчас много говорят про развитие ИИ и computer vision в контексте ФПВ, дронов, определения дронов и многого другого. 

Любая подобная модель строится на двух китах:

— Compute capacity 

— Training data 

Вам нужны вычислительные мощности и вам нужны данные. Можно self-supervised, когда одна модель лейблит и готовит данные для другой модели, но нужны данные. 

На сейчас Украина это главный в мире обладатель, хранитель и производитель видео военной тематики для обучения подобных систем. С гигантским, закаливающим преимуществом над любой другой страной, даже Израилем и США. Каждый день создаются тысячи и тысячи видео операторов ФПВ, разведывательных дронов, БПЛА, ударных дронов, ночная оптика, записи с камер на танках, Бредли, БМП и многое другое. 

Тысячи часов видео «от первого лица» самой крупной войны в мире — золотая находка для любого производителя ИИ системы, который захочет натренировать свою модель. 

В общем, идея в том, что Украина должна подойти к вопросу системно и обратит этот ценнейший актив в свое новое золото. Без шуток. Это действительно — «золото» 21 века наряду с вычислительными мощностями. 

План простой как паренная репа: 

Украина создает свой дата центр (желательно несколько для безопасности) под землей, с питанием — все как положено. 

Создается (если еще нет) система, которая собирает со всего фронта видео операторов, каталогизирует, ставит лейблы и сохраняет их в дата центре. 

Дальше Украина по лицензии продает доступ к этому бездонному видео архиву избранным западным производителям техники. Я без шуток могу себе представить что при должной организации условный Lockheed Martin будет готов произвести и поставить Украине условные 15-20 F16 в обмен на полный доступ к архиву на сотни тысяч видеозаписей «боевых вылетов». Ценность этот training set где-то в таком диапазоне и лежит ибо он — ключ к созданию nextgen автопилотируемых ИИ систем, на порядок сильнее моделей прошлого десятилетия.

Ценнейший актив в руках Киева, надо пользоваться.

Leave a comment

Your email address will not be published. Required fields are marked *