Принципы создания датасета для систем компьютерного зрения в ритейле
![Принципы создания датасета для систем компьютерного зрения в ритейле Принципы создания датасета для систем компьютерного зрения в ритейле](/upload/iblock/774/x774bb13c3af6ff7df7a10510c8a714a1.jpg.pagespeed.ic.kwbuGRHlLS.jpg)
время публикации: 10:00 19 октября 2020 года
Датасет – это данные, которые необходимы для обучения нейронных сетей. Разметка изображений – неотъемлемая часть разработки систем искусственного интеллекта и одна из основных задач в технологии компьютерного зрения. Как собрать и разметить фотоизображения товаров для успешной реализации проектов цифрового мерчендайзинга?
![Юлия Порохненко Принципы создания датасета для систем компьютерного зрения в ритейле](/upload/medialibrary/9c7/x9c7b43738a922efc3022da65458ce20d.jpg.pagespeed.ic.JqPnAkBrxa.jpg)
Сегодня готового универсального датасета для цифрового мерчандайзинга не существует, поэтому перед ритейлерами встаёт вопрос: выполнить разметку на стороне поставщика решения или собрать данные самому. Наличие собственного размеченного датасета кроме экономии бюджета позволяет свободно выбирать исполнителя: с датасетом можно устраивать хакатоны, тендеры и определить лучшие модели распознавания или готовые продукты.
Этапы подготовки датасета
Сбор фотографий
Основные требования к фотографиям:
● фотографии должны быть хорошего качества, сделанные при достаточном освещении;
● снимать полку необходимо фронтально, захватывая как можно большую площадь, по возможности объекты на полке не должны быть обрезаны;
● чем больше фотографий будет приходиться на каждый SKU, тем лучше;
● минимальное количество фотографий – 200 изображений на один SKU.
![Принципы создания датасета для систем компьютерного зрения в ритейле Принципы создания датасета для систем компьютерного зрения в ритейле](/upload/medialibrary/9fa/x9fa2e82e990338808d8f42ee92e18ca8.jpg.pagespeed.ic.wS-V-aInw6.jpg)
Разметка фотографий
Разметка данных – самый трудоемкий этап в разработке решений в области компьютерного зрения. На этом шаге каждому объекту на изображении ставится в соответствие метка, обозначающая SKU, к которому и принадлежит этот объект. Аннотированные изображения нужны в качестве входных данных для обучения нейронных сетей.
Существует ряд готовых решений для разметки фотографий: ImageTagger, LabelImg, Lionbridge AI, TrainingData.io, Hive, Scale, Supervise.ly. Некоторые из них, например, ImageTagger и LabelImg, бесплатные, руководства по их установке и использованию можно найти на GitHub. Стоимость использования платных сервисов зависит от количества фотографий, SKU и аннотаций. Подробную информацию можно узнать на официальных сайтах.
Прежде чем приступить к разметке, данные необходимо структурировать. Фотографии можно распределить согласно заданной логике, например, каждая планограмма будет размещаться в свою папку. Так будет проще ориентироваться в данных и искать изображения.
Читайте также: От ручного труда к автоматизации: как нейронные сети помогают контролировать наличие товаров на полках
Необходимо составить список меток. Для этого можно использовать справочник актуальных SKU, которые есть в магазине, или товаров определенного поставщика.
Название меток должно быть однозначно интерпретируемым, то есть соответствовать только одному SKU. Если метка называется, например, «газированная вода в бутылке», то невозможно наверняка определить, о каком именно артикуле идёт речь.
После того, как список сформирован, можно приступать к разметке фотографии: выделение объекта на фотографии в рамку. Это может быть прямоугольник, полигон, параллелепипед. Стороны рамки должны плотно прилегать к границам объекта.
![Принципы создания датасета для систем компьютерного зрения в ритейле Принципы создания датасета для систем компьютерного зрения в ритейле](/upload/medialibrary/c6c/xc6c2c318c185834b05239d418032cdf6.jpg.pagespeed.ic.UV2K1-C1S3.jpg)
На этапе разметки фотографий стоит учитывать, что эту задачу могут выполнять несколько сотрудников, у каждого из которых своё представление о правильности аннотирования, поэтому рекомендуем выпустить инструкцию, в которой будут однозначно регламентированы правила.
![Принципы создания датасета для систем компьютерного зрения в ритейле Принципы создания датасета для систем компьютерного зрения в ритейле](/upload/medialibrary/5d1/x5d1f82ac73b9f2e28380174a18af28a3.jpg.pagespeed.ic.6NOnLYaytq.jpg)
Результат разметки – это набор данных, который содержит информацию о названии фотографии, её размерах, метки и координаты границ всех объектов.
![Принципы создания датасета для систем компьютерного зрения в ритейле Принципы создания датасета для систем компьютерного зрения в ритейле](/upload/medialibrary/e5a/xe5a55311fd5d6eb315ad9f4a6a9c3e92.jpg.pagespeed.ic.pZN5xOArvh.jpg)
Заключение
На рынке существует много сервисов для аннотации изображений, в том числе бесплатных. Кроме того, некоторые компании, занимающиеся разработкой продуктов в области компьютерного зрения, предлагают собственные системы.
Сбор данных и разметка фотографий – необходимый этап для проектов цифрового мерчандайзинга. Качественно подготовленные материалы – залог успешного обучения нейросети, а значит и эффективности полученного решения.
Юлия Порохненко, аналитик данных Beltel Datanomics
Для New Retail
0
Последние новости
Самое популярное
-
Главные новости маркетплейсов за май 2024
-
Как выстроить стратегию ценообразования на маркетплейсах, торгуя на нескольких п...
-
Опыт Fix Price: как ритейлер создает СТМ и работает с собственными марками
-
Прогноз большого потока данных как «предсказатель» курса развития бизнеса
-
6 проверенных способов оплаты товаров из Китая