©2019 Deep Learning School

 

Deep Neural Projects

(1st part of the course: Images)

Всего есть 13 проектов по первой части нашего курса. Все они так или иначе связаны с обработкой изображений, поскольку первая часть курса посвящена преимущественно компьютерному зрению.

В этом семестре нет возможности предложить свой проект.

Если не оговорено иное, в проекте подразумевается работа в Jupyter Notebook'ах, и, при желании, реализация функционала в виде веб-демо, мобильного приложения или бота.

1. Image Search Engine

В этом проекте вам предстоит реализовать свой мини-поисковый движок по картинке.

Есть некоторая база изображений (будет собрана вами и вашим ментором для проекта), на вход поступает новая картинка и нужно вывести наиболее похожие на неё картинки из базы

(скажем, топ-10 похожих).

2. Face Recognition

В этом проекте нужно реализовать систему распознавания лиц. Есть некоторая база изображений с лицами людей для 5-10 человек. Нужно по входному изображению говорить, является ли этот человек одним из тех 5-10, и, если да, то какова вероятность этого.

3. Face Keypoints Detector

На вход поступает изображение лица человека, и необходимо детектировать точки его лица

(будет заранее задано, какие именно, их будет фиксированное количество).

4. Image Captioning

В этом проекте нужно реализовать нейросеть, которая по входному изображению печатает его текстовое описание. Примеры работы можно видеть на изображениях выше.

5. Segmentation in Medicine

В этом проекте нужно будет написать нейросеть, которая качественно сегментирует медицинские снимки, выделяя на них регионы нужного типа.

6. 3D Pose Estimation

Здесь вам предстоит написать нейросеть, которая по изображению предсказывает

позу человека в 3D. Будет фиксированный набор точек тела,

необходимо все их точно предсказывать и соединять линиями, получая трёхмерный скелет.

7. Text Extraction

В этом проекте нужно поработать над извлечением текста с изображений.

На вход поступает картинка, нужно распознать регионы с текстом на картинке

и вывести текст из них на экран.

8. Age Recognition

По лицу человека предсказать его возраст.

9. Image Question Answering

На вход поступает изображение и вопрос. Например: "Сколько детей на этом изображении?".

Нужно уметь точно отвечать на этот вопрос по изображению.

10. Gesture Action Recognition

В этом проекте нужно по изображению предсказывать положение кистей рук, а именно: положение всех фаланг пальцев и нижних точек кистей. Делать это нужно максимально точно и быстро, ведь потенциально эта технология может быть использована при управлении жестами в реальном времени.

11. Classification Bot

Проект состоит в том, чтобы написать бота (в Telegram или в ВК), который по присланному ему изображению будет выдавать класс изображённого объекта.

12. Style Transfer Bot

Проект состоит в том, чтобы написать бота (в Telegram или в ВК), который по присланным ему изображениям стиля и фото будет возвращать картинку с перенесённым на фото стилем.

13. Style Transfer Filters

В данном проекте акцент делается на реализацию наиболее быстрого и качественного переноса стиля на фотографии людей, создание так называемых "фильтров".