Ученые выяснили, каким воспринимают окружающий нас мир наши компьютеры
Практически всем известно, что компьютеры при помощи камер могут "смотреть" на окружающий нас мир и распознавать то, что они видят при помощи специализированных алгоритмов распознавания объектов. Более того, при помощи других алгоритмов компьютеры могут различить одушевленные и неодушевленные объекты, "узнать" лица отдельных людей и вычислить эмоции, обуревающие человека в данный момент времени. Но, до последнего времени еще никто не задавался вопросом, а в каком же действительно виде компьютеры воспринимают окружающий мир? Ответ на этот вопрос попытались дать ученые из университета Вайоминга (University of Wyoming) и Корнуэльского университета (Cornell University), которые работают в направлении искусственного интеллекта и компьютерного распознавания образов. Их исследования дали вполне прогнозируемый результат - компьютеры видят мир совершенно по-своему, совсем не таким, каким его видим мы с вами.
В своих экспериментах ученые использовали одну из самых современных реализаций нейронных сетей (deep neural network, DNN), ориентированную на обработку изображений и распознавание образов на этих изображениях. "Скормив" этой сети миллионы изображений, ученые добились четкого распознавания ею объектов, после чего сеть стала способна отличать объекты одного вида от объектов другого вида, к примеру, собак от дельфинов.
По завершению обучения нейронной сети в нее был внедрен так называемый генетический алгоритм, который позволяет синтезировать новые изображения из наборов уже имеющихся изображений. Такая технология иногда называется эволюционным искусством, а в большинстве случаев процесс превращения изображений в новое изображение производится под руководством человека, который оценивает конечный результат. При таком подходе человек, взяв за основу изображения дельфина, на выходе получит нечто, также напоминающее или имеющее пусть и отдаленное сходство с этим животным. Но исследователи заменили человеческий фактор и человеческое восприятие восприятием самого компьютера, получив на выходе весьма неопределенные результаты.
"Мы ожидали, что на выходе программы мы получим те же самые вещи, которые были переданы на ее вход. И эти изображения должны быть высококачественными хорошо распознаваемыми изображениями" - рассказывает Джефф Кльюн (Jeff Clune), - "Но вместо этого мы получили набор весьма причудливых изображений, к примеру, дельфин в понимании компьютера выглядит совсем не как дельфин".
В некоторых случаях процесс синтеза изображений привел к результату, который можно охарактеризовать термином "цветной художественный белый шум", другие же изображения весьма смахивают на работы художника-абстракциониста, находящегося под воздействием какого-либо препарата. С точки зрения человека на таком изображении не содержится ни крохи полезной информации. Тем не менее, программа нейронной сети с 99-процентным успехом идентифицировала эти изображения как конкретные объекты, к примеру, электрогитару или рыбу-зебру. Согласно исследователям, эти изображения являются своего рода оптическими иллюзиями для компьютеров, которые, при должном использовании, могут стать проблемой для систем распознавания объектов, лиц и т.п.
Люди обычно идентифицируют объекты, смотря на изображение объекта в целом. У компьютеров с этим дело обстоит несколько по-другому, они выбирают лишь те черты и особенности объекта, которые отличают его от всех других известных объектов. И то, что получилось в результате работы программы, является визуальным отображением этих отличительных черт объектов, в том виде, в котором их представляет себе компьютер.
В своих экспериментах ученые использовали одну из самых современных реализаций нейронных сетей (deep neural network, DNN), ориентированную на обработку изображений и распознавание образов на этих изображениях. "Скормив" этой сети миллионы изображений, ученые добились четкого распознавания ею объектов, после чего сеть стала способна отличать объекты одного вида от объектов другого вида, к примеру, собак от дельфинов.
По завершению обучения нейронной сети в нее был внедрен так называемый генетический алгоритм, который позволяет синтезировать новые изображения из наборов уже имеющихся изображений. Такая технология иногда называется эволюционным искусством, а в большинстве случаев процесс превращения изображений в новое изображение производится под руководством человека, который оценивает конечный результат. При таком подходе человек, взяв за основу изображения дельфина, на выходе получит нечто, также напоминающее или имеющее пусть и отдаленное сходство с этим животным. Но исследователи заменили человеческий фактор и человеческое восприятие восприятием самого компьютера, получив на выходе весьма неопределенные результаты.
"Мы ожидали, что на выходе программы мы получим те же самые вещи, которые были переданы на ее вход. И эти изображения должны быть высококачественными хорошо распознаваемыми изображениями" - рассказывает Джефф Кльюн (Jeff Clune), - "Но вместо этого мы получили набор весьма причудливых изображений, к примеру, дельфин в понимании компьютера выглядит совсем не как дельфин".
В некоторых случаях процесс синтеза изображений привел к результату, который можно охарактеризовать термином "цветной художественный белый шум", другие же изображения весьма смахивают на работы художника-абстракциониста, находящегося под воздействием какого-либо препарата. С точки зрения человека на таком изображении не содержится ни крохи полезной информации. Тем не менее, программа нейронной сети с 99-процентным успехом идентифицировала эти изображения как конкретные объекты, к примеру, электрогитару или рыбу-зебру. Согласно исследователям, эти изображения являются своего рода оптическими иллюзиями для компьютеров, которые, при должном использовании, могут стать проблемой для систем распознавания объектов, лиц и т.п.
Люди обычно идентифицируют объекты, смотря на изображение объекта в целом. У компьютеров с этим дело обстоит несколько по-другому, они выбирают лишь те черты и особенности объекта, которые отличают его от всех других известных объектов. И то, что получилось в результате работы программы, является визуальным отображением этих отличительных черт объектов, в том виде, в котором их представляет себе компьютер.
Дата публикации: 23-01-2015