Решение проблемы понимания контекста искусственным интеллектом. часть 1

      Комментарии к записи Решение проблемы понимания контекста искусственным интеллектом. часть 1 отключены

Решение проблемы понимания контекста искусственным интеллектом. часть 1

Познание естественного языка есть AI полной задачей. Одним из качеств для того чтобы понимания есть познание контекста. В данной статье я растолкую, какие конкретно виды контекста выделяет отечественная психика, как она трудится с одним из видов контекста, и как мы данный процесс воссоздаем в отечественной технологии ИИ.

The trophy doesn’t fit into the brown suitcase because it’s too [small/large].
What is too [small/large]?
Answers:The suitcase/the trophy.
The Winograd Schema Challenge

В прошлой статье обрисован отечественный подход к разработке ИИ да и то, что нами уже сделано на настоящий момент. Напомню, что мы создаем ИИ методом процессов психики и прямого копирования структур человека.

Два вида контекста

По комментариям к прошлой статье мы заметили, что термин «контекст» используется для описания весьма различных обстановок. Мы разглядываем данный термин, разделяя его на два вида.

Первый вид контекста — в то время, когда речь заходит о понимании, вытекающем из раздавшихся в данной фразе понятий. Это ситуации выбора одного из значений омонимов, подбор синонима, выбор одного из нюансов смысла и пр. К примеру:

«Глаза слезились, в то время, когда она резала для салата Современная» стрельба «и лук из лука делится на пара направлений».

Человек «на лету» осознаёт, в то время, когда речь заходит о луке-растении, а в то время, когда о луке — разновидности оружия.

Второй вид контекста — в то время, когда для понимания приходится выделять некую категорию, обычно в самом тексте не представленную либо очень не выделенную. Как раз такая категория разрешает сформулировать некую «идею», обобщенно высказывая то, о чем говорится.

К примеру, если вы в книге Льва Толстого встретите фразу «Он распечатал письмо…», то для верного понимания текста вы завлекаете категорию «19 век», и делаете вывод, что речь заходит не о принтере. Данный вид контекста подразумевает, что для интерпретации и понимания текста может производиться анализ не только всего текста, но и связанных с ним данных.

Ответ задач, которые связаны с различными видами контекста, обслуживаются полностью различными процессами психики. Такое же разделение мы повторяем в отечественной разработке ИИ. В ответе задач первого типа употребляется способ, основанный на особенности хранения знаний.

В ответе задач второго типа реализуется более сложный метод, основанный на опыте (при ИИ речь заходит об методах, компенсирующих отсутствие настоящего людской опыта у совокупности), и предполагающий больший количество вычислений.

Психика человека значительно чаще сначала пробует применить первый способ, т.к. он требует значительно меньше вычислительных ресурсов. В случае если же ответ не выглядит адекватным, то тогда психика применяет второй. Помимо этого, чем выше интеллект, тем чаще употребляется большее число и второй метод вероятных контекстов учитывается.

Дети, в виду ресурсоемкости и сложности второго способа, и взрослые, не привыкшие к умственному труду, предпочитают первый.

Мы обрисуем, как отечественная разработка ИИ трудится с первым видом контекста. Как мы трудимся со вторым, более сложным, будет обрисовано в следующей статье.

Дольше та коса, у которой меньше связей

Для иллюстрации заберём обстановку диалога:

«Я тут иду по набережной и заметил косу. Весьма интересно, какая коса самая долгая?»

Ответ, выстроенное на нейронных сетях, в силу ограничений, накладываемых самим способом, наверное не сможет адекватно ответить. Кроме того в случае если для поиска ответа в НС будет загружено довольно много текстов, то, опираясь на возможность, раздастся цифра «5.6 метра».

Напомню, что отечественную разработку ИИ мы разрабатываем, последовательно копируя ее процессы и психику. Семантическая сеть, которую мы используем для хранения знаний, отражает изюминке обработки и хранения информации человеком. Исходя из этого в рамках отечественного подхода задача решается достаточно легко.

В ответе, соответствующем семилетнему возрасту, метод обращается к семантической сети и находит вершину, которая находится в узле, к которому относятся слова, услышанные ранее. В приведенном выше примере нужно верно выбрать один из омонимов: коса (прическа) и коса (полоса суши, соединенная с берегом) коса (инструмент). Для этого анализируется, о каком узле семантической сети шла обращение ранее.

Т.е. выполняется несложная процедура расчета минимального расстояния до понятий, применяемых в тексте ранее. В отечественной сети расстояние это функция от количества связей (прямо пропорционально) и их возможности (обратно пропорционально).

Расстояние от «коса (полоса суши)» до «набережной» будет на два порядка меньше, чем от «коса (прическа)» до любого из этих понятий. ИИ даст ответ «110 км».

Нужно подчернуть, что эта задача решается и вторым методом, с выделением категории, к примеру «река Волга, рядом с которой отечественный собеседник».

Грузчики видят чемоданы По другому

Разглядим пример из схемы Винограда, приведенный в начале статьи:

«The trophy doesn’t fit into the brown suitcase because it’s too small. What is too small?»

Связь между «doesn’t fit» и сочетанием «too small»-«suitcase» на порядок возможнее, чем между «doesn’t fit» и «too small»-«trophy». ИИ даст ответ «suitcase».

Наличие высокой возможности у таковой связи, предполагающей на порядок меньшее расстояние в цепочке «doesn’t fit»-«too small»-«suitcase», обусловлено опытом человека. Я, как и большая часть, довольно часто сталкивался с обстановкой, в то время, когда что-то не влезает в чемодан, поскольку он через чур мелок. Из этого и такая сообщение у меня.

Такие же связи формируются в ходе обучения ИИ (подробнее о формировании разных видов связей в психике мы обрисуем в одной из следующих статей о отечественной семантической сети).

«The trophy doesn’t fit into the brown suitcase because it’s too large. What is too large?»

Связь между «doesn’t fit» и сочетанием «too big»-«trophy» значительно возможнее, чем между «doesn’t fit» и «too big»-«suitcase». ИИ даст ответ «trophy».

Отмечу особенность — у грузчиков, каковые довольно часто сталкиваются с обстановкой, в то время, когда нужно поместить через чур большой чемодан, психика применяет второй способ понимания контекста. Т.к. для них сообщение «too big»-«suitcase» более актуальна. Наряду с этим для туристов трудится другая система — наровне с нарастанием опыта обстановок, в то время, когда сложно поместить куда-то чемодан, возрастает невозможность конструкции «не получается что-то положить в чемодан, по причине того, что чемодан через чур большой».

Для решения, соответствующего 12-летнему возрасту, формула пара сложнее. Причем организованный к этому возрасту подход реализуется и у взрослого человека — по окончании 12 лет эта часть сети-методов не усложняется.

Практически, легкость ответа определяется спецификой отечественного похода. Все ситуации, которые связаны с коммуникацией, вся лингвистика, организованы с участием структур психики человека. Фактически, вся специфика в области языка и определяется этими структурами. Действительно, имеется и обратный процесс, в то время, когда язык определяет структуру. Налицо взаимообуславливание. Не страно, что посредством этих структур (психологических) появляющиеся задачи решаются самым легким образом.

Гайку нужно откручивать гаечным ключом, они созданы приятель для приятеля. А не ложкой.

Отмечу, что не считая громадных преимуществ, отечественный подход к разработке ИИ привносит и кое-какие сложности. Вычислительная архитектура не соответствует физиологической базе, и мы иногда решаем технические задачи по качественному отображению структур и процессов психики в цифре. Кроме этого, из-за имеющихся допущений и корректив, какая-то часть ресурсов уходит на обеспечение тождественности семантической сети и методов ИИ алгоритмам и структурам настоящей психики.

Следующая статья будет о втором виде контекста, и она будет, к сожалению, значительно тяжеловесней. Нам не обойтись без глубокого погружения в психотерапевтические процессы при описании методов работы со вторым видом контекста в отечественной технологии.

Главная опасность искусственного интеллекта — The Night Air


Интересные записи на сайте:

Подобранные по важим запросам, статьи по теме: