машинное обучение06 мая 2020

Подборка статей о машинном обучении: кейсы, гайды и исследования за апрель 2020

Артем СалютинРуководитель проектов

Продолжаем отбирать публикации, которые помогают снизить порог входа в сферу ML. Как и прежде, здесь в первую очередь собраны инструменты с открытым исходным кодом, предобученные модели и высокоуровневые API.

Blender

Facebook AI представили самый масштабный опенсорсный чатбот Blender. В его основе модель, у которой 9,4 миллиарда параметров, что делает ее самой крупной системой из существующих. Это первый open-domain чат-бот, который объединяет разнообразные разговорные навыки в одной системе: способен выражать сочувствие и проявлять индивидуальность. Если верить авторам исследования, Blender по всем параметрам лучше чем Meena, которую ранее в этом году анонсировали Google, но так и не продемонстрировали.

Background-Matting

Машинное обучение часто используется для удаления фона с изображений. Если со статическими изображениями результаты уже давно очень хорошие, и есть даже целые сервисы вроде remove.bg, то теперь этого можно добиться и для видео — хромакей больше не нужен! Появился бесплатный инструмент, который прекрасно справляется с удалением фона с видео. Для нужного результата необходимо сделать снимок фона без человека и дальше алгоритмы машинного обучения делают свою магию. Результаты потрясающие, в самой публикации можно посмотреть бенчмарки.

De-occlusion

Существующие алгоритмы машинного обучения способны анализировать только видимые части объектов. Это приводит к неполной интерпретации сцены. Теперь появился опенсорс фреймворк, который способен дополнять скрытые из виду фрагменты объектов в изображении. Инструмент сделан на основе модели, обученной без привлечения учителя.

TensorFlow Profiler

Производительность является ключевым фактором при проведении исследований в области машинного обучения. Чем быстрее проходит обучение модели, тем больше можно совершать итераций, сокращая накладные расходы. Это очень важно при промышленной разработке. Однако не всегда понятно, что следует оптимизировать, и на поиск узких горлышек уходит время. Теперь для TensorFlow появился набор инструментов, призванный решить эту проблему.

Quant-Noise

Современные модели машинного обучения становятся все объемнее и содержат миллионы параметров. При этом существует острая потребность запускать эти модели на слабых устройствах. В попытках решить это противоречие, появился опенсорсный инструмент, который обеспечивает максимальное сжатие моделей практически без потери в их производительности. В дальнейшем это позволит запускать приложения локально на мобильных устройствах и IoT-чипсетах.

TensorFlow Lite

Впрочем, существует уже множество моделей, который оптимизированы под слабые девайсы. В этой публикации показано, как не имея опыта в машинном обучении, с помощью TensorFlow Lite собрать полноценный продукт. Количество предтренировочных моделей в репозитории постоянно пополняется, таким образом ничто не мешает уже сейчас создавать мобильные приложения, в сердце которых будут модели машинного обучения.

Style transfer

Помните приложение Prisma, которое переносило художественный стиль на фотографии пользователей с помощью нейронной сети? Сейчас таким уже никого не удивишь, но зато теперь можно собрать собственную призму для Android и iOS. В публикации рассказывается о том, как эта техника оптимизирована под TensorFlow lite, чтобы поддерживаться не очень мощными мобильными устройствами. Кстати, в апреле такая же функция появилась в приложении Google Arts & Culture.

Бонус:

Стэнфордский университет выложил в открытый доступ курс лекций 2018 года, который теперь можно посмотреть на Youtube.