Написать письмо
 

Ваш е-майл

Ваше имя

Ваше сообщение


 
новое! собираю для себя и для других:
команды и скрипты на bash

шаблон документа word для различной документации

Моя биография в компьютерах и технологиях

О распознавании образов

новое! О юзабилити

My Wishlist

Алиев Рауф, РБК

резюме | фото | жж | программы | проекты | новости
iway.ru

Кто хочет — тот ищет способ, кто не хочет — ищет причины...

все для PM | рисунки
кое-что о распознавании образов

Прочитал в "компьютерре" статьи, посвященные искусственному интеллекту и программной эмуляции работы мозга. Вспомнилось, когда-то я занимался подобной темой.

Как-то, сидя на скучных лекциях, я понемногу размышлял по теме распознавания образов, даже был какой-то прототип, распознающий буковку А, написанную любым способом в матрице. Результаты так себе, но вот собственные мысли и выводы, к которым я тогда пришел, были не совсем оптимистичными. Сразу оговорюсь, терминология плавает - я уже далеко от этой темы.

Итак, эти мысли упирались в то, что те способы, которыми мы получаем "слепок" объекта, вносят в информацию непоправимый "шум". Этот "шум" сильно искажает оригинальную информацию об объекте. И вообщем-то все распознавание сводится, в основном, к усилиям, как из этой "грязи" вытащить объект, а уже потом - как из того, что у нас осталось, выделить класс объекта и определить его сущность.

Основные методы фиксации - изображение объекта - несет информацию не столько об объекте, сколько о световой картине вокруг него. Например, это отражения падающего света, собственного цвета и светимость объекта. Форма объекта тут второстепенна, а именно ее часто необходимо выделять. В случае распознавания текста проблемы попроще, т.к. фактически мы распознаем не 3D, а 2D-сцену, в которой вся цветовая картина, как правило, приводится к двуцветному контрастному плану.

Вторым методом, который может использоваться в дополнение, может быть анализ объекта с помощью анализа отраженных от объекта волн. Это всевозможные радары, ультразвуковое исследование и проч. Ну и инфракрасная картина объекта сюда же.

И на этом, насколько я знаю, все заканчивается. Больше способа получить информацию об окружающем мире нет. Первый способ дает плоскую картину из трехмерной, выполняя проекцию изображения на плоскость, второй - дает с той или иной точностью глубину, но теряет информацию, например, о цвете.

Как мне кажется, существенным прорывом в этой области будет создание третьего способа, позволяющего совместить достоинства этих двух и получить в результате более информативную картину анализируемой сцены. В идеальном случае этот способ должен обрабатывать несколько измерений и на их основе сразу рождать более уточненную информацию по форме и цвету объекта.

Теперь по самим алгоритмам распознавания.

Я думаю, что следующий шаг в этом направлении - возврат от цифровой техники обратно к аналоговой. Но это должна быть уже значительно "продвинутая" аналоговая техника, специализирующаяся под конкретную задачу.

Технологически необходимо иметь аппаратное решение, позволяющее хранить информацию аналогового типа, где данные не рассованы по ячейкам, как это происходит в дискретных, цифровых хранилищах, а имеют непрерывную природу. То есть координаты каждой ячейки - набор реальных чисел с произвольной точностью в системе координат, а их значения - другой набор реальных чисел. Система координат также не факт, что декартова - ее удобство тут под сомнением. Разумеется, хранится информация с определенной точностью, глубже которой опускаться можно, но бесполезно - новых данных мы этим не почерпаем. Например, одну и ту же сцену можно иметь в разных режимах фокусировки и освещения и, возможно, снятой с разных точек. И эта сцена не хранится в виде большой матрицы, а хранится в каком-то подобии голограммы.

Так вот, вторым необходимым свойством такого хранилища должны быть возможности быстрой трансформации хранимого объекта. Поскольку данные хранятся в аналоговой форме, транформация может проводиться наложением волн - сразу по всей информационной картине. В результате трансформация производится значительно быстрее, чем в случае, если бы это делалось в цифровом варианте объекта.

Как пример, тут можно напомнить, как работает анализатор штрих-кода на кассах в супермаркетах - его задача распознать штрих-код в любом ракурсе, наклоненным или повернутым. Это делается за счет системы вертящихся зеркал, которые с большой частотой транслируют изображение штрих-кода на матрицу в разных вариантах поворотов и искажений. В результате какой-то один вариант, "ровненький", опознается как верный по каким-либо быстро определяемым признакам и изображение распознается.

Тут та же картина - распознавание такого "аналогового слепка" объекта может происходить путем его трансформации с такими же "аналоговыми слепками"-шаблонами и в случае, если произошло совпадение по одной из характеристик, мы получаем значительный "вплеск" (помните, наложение волн из курса физики?). Набор таких "всплесков" показывает, что данный шаблон в чем-то соответствует "слепку" и необходимо двигаться в анализе в его направлении.

Третьим важным свойством была бы транформация преобразования из одного эталонного слепка в другой. Там, где эта трансформация проходит ровно (т.е. без значительных скачков параметров), объекты считаются близкими. При распознавании объекта происходит сопоставление не только с объектами-эталонами, но и их промежуточными вариантами. Мы помним, что объекты хранятся не в цифровом виде, а в аналоговом, так что хранить промежуточные варианты не надо - они "на лету" должны трансформироваться между двумя эталонными.

Таким образом, можно хранить объекты разной детализации, разных форм и размеров и за счет анализа объекта вышеописанным образом, происходит опознавание новых объектов и сохранение информации в такой же структуре, но с большим уточнением.

Я намеренно не называл объекты изображениями - дело в том, что для каждого пространственного элемента можно хранить не только цвет, но и другие параметры - температуру, свойства материала и пр. Не известны еще способы хранения такой информации - сейчас все сильно зациклено на цифру. И о разработках систем, оперирующих аналоговой информацией все реже и реже слышно.


Добавить комментарий