т.е.ИИ не умеет в отличить что фотографировали? ИИ не знает в приоритеты, что основное на фото, а что просто общий фон композиции?
По сути нет. Каждая проблема решается отдельно. Он вообще не человеческими категориями "видит".
Классический пример обмана системы управления беспилотным автомобилем. Увидев этот слегка измененный дорожный знак она не останавливает машину, а всего лишь сбрасывает скорость до 72 км/ч
Подходы разные. Раньше до 2017 года в основном было скользящее окно. Сейчас прямая сегментация. Если именно просто по фото сказать что на нем, то около 500 категорий тот же Алекснет распознает. На входе картинка размером 227*227 пикселей. По сути там будет на 70% сено, 7% девка, 10% лошадь.
Есть вариант сегментации по категориям. Типа детской раскраски. Там сейчас число категорий не превышает 15-20.
Над всем этим работают. Но до идеала это не доведено.
Пытаются заставить описывать ИИ что происходит на картинке и прочее.
GT - это ручная разметка.
Как пример нейросети подсовывали машину перевернутую крышей в озеро. Машину она там не узнает.
Чтобы обучать это дело на высоком уровне сейчас нужны видеокарты с 32 гигами видеооперативки и более. Штук по 10.
Та же капча гугла. Он ее не просто так придумал... Бесплатные человеки распознают квадратики.
По факту на фоне архитектуры человеческого мозга это все шляпа.
Google оцифровала кусочек человеческого мозга. Он весит 1,4 петабайта
Компания Google и ученые Гарвардской лаборатории Лихтмана перенесли
один кубический миллиметр мозга в «цифру».
Такой объем ткани коры головного мозга сопоставим с более чем 700 жесткими дисками объемом 2ТБ каждый. С помощью новой разработки ученые смогли собрать необходимые данные. Метод просвечивающей электронной микроскопии имеет разрешение 4 нм. Исследователи разделили кусочек мозга на 5300 секций толщиной 30 нм.
Всего получилось 225 миллионов 2D-снимков. После сканирования изображения передали Google для создания 3D-картинки. При помощи системы облачных вычислений и ИИ-алгоритма Google объединила все фрагменты в 3D-модель, ее объем составил 1,4 петабайта. В дальнейшем инженеры планируют сжать полученную информацию с помощью машинного обучения.
Образец ткани мозга был получен во время операции пациента, страдающего от эпилепсии. Детальное изучение мозга на микроуровне поможет ученым понять природу заболеваний и научиться диагностировать их на ранних стадиях.