Именно такой подзаголовок хочется дать книге Леонида Черняка «Путеводитель по истории Искусственного Интеллекта». Работа фундаментальная, кажется, упомянуто всё, что хоть как-то можно связать с этим понятием. Собственно, и начинается книга с раздела «О названии, терминологии и дискурсивных полях», где предпринимается попытка договориться о самом термине, который, по мнению автора, извратили при переводе: «английское artificial с русским «искусственный» близки, но они далеко не тождественны. Подавляющая часть значений английского artificial (от art – искусство, мастерство), так или иначе, связана с понятием «рукотворный», а в русском, как утверждают лингвисты, слово искусственный ведёт происхождение из немецкого künstlich, значащего, скорее, поддельный».
Собственно, эти рассуждения, аргументированные огромным количеством цитат великих (пусть в своей узкой области, но зато эта область сегодня едва ли не важнейшая), и составляют, на мой взгляд, главную ценность книги.
Надо сказать, что моё понимание ИИ (буду использовать традиционную русскую аббревиатуру) было другим, и точно более негативным, поскольку я видел в нём главным образом некое мошенничество.
Здесь же самые интересные места были про извлечение смысла. Что это такое, я как тот экскурсовод в анекдоте про «на всякий случай», объяснить в двух словах не смогу, но на примерах сумею показать. Эти примеры из журнала «Компьютерра» – с удовольствием бы дал ссылки на оригинальные статьи, но, к сожалению, не могу вспомнить ни авторов, на названия, а помню только… ну да, тот самый смысл.
Первая статья о том, что на самом деле мы «видим мозгом» не то, что видим глазами, потому что на автомате дополняем реально увиденное своими знаниями о предметах. Возможно, это же касается и других органов чувств, но насчёт зрения – это точно.
Так вот, автор той статьи предложил читателям сказать, что они видят на этом изображении.
Потом на вот этом. В журнале они были на разных страницах, надо было перелистывать, здесь же у нас есть возможность открывать рисунки по клику мышки.
Наконец, когда читатель уже сдался в попытках угадать, на последней странице статьи была напечатана картина целиком, и в контексте картины уже ни у одного человека не может возникнуть сомнений о том, что же изображено на фрагментах. Отсюда становится ясно, что никакая программа распознавания образов, натасканная на сопоставление этих объектов с теми, на которых проводилось её обучение, никогда не сможет указать, что на второй картинке изображена лошадь, и, если так можно выразиться, с большим запасом не распознает на первой картинке голову лошади. Да и вагон на вагон не сильно похож,
и окно на окно.
И только всё вместе, в едином контексте приобретает смысл.
Второй пример чисто умозрительный. В нём автор рассматривает работу переводчика и утверждает, что переводчик сначала должен понять смысл написанного, и только после этого найти подходящие слова для донесения этого смысла до целевой аудитории. Венчало статью изумительное рассуждение о том, что если (или когда – тут точно не помню) таковой переводчик появится, не удивляйтесь, прочитав на экране сообщение: «с текстом я разобрался, но извини, тебе этого всё равно не понять».
Как сказал поэт «смешно, да не до смеха». Однажды при переводе английского текста мне встречается бессмысленная фраза – «а эти ребята научились хранить данные с помощью известняка (limestone)». Если бы это был кремний, то понятно было бы образное выражение – но какое отношение к хранению данных имеет известняк? Лезу на сайт компании, о которой шла речь, и нахожу, что один из своих ЦОДов они разместили в известняковых штольнях! Да, я потратил время, но вскоре я увидел другой материал, переведённый человеком, в совершенстве знающий английский и свободно на нём разговаривающим. В том английском тексте было слово «mine», которое он перевёл как «карьер». В отличие от штолен, карьер является открытой выработкой, и устанавливать в нём сервера никто бы не стал. Получается, что здесь надо понимать и способы добычи камня, и преимущества установки оборудования в толще породы.
Наверное, самой большой проблемой является отсутствие универсального языка смыслов, что-то вроде эсперанто, «общего знаменателя», к которому можно привести все явления, события, изображения и прочие сущности. Частично нам это всё же удаётся, и это наглядно демонстрирует число. «Пять», «5», «V» - смысл любого из этих символов нам понятен – это число 5, выраженное «прописью», арабской или римской цифрой. Но, к сожалению, это частный случай.
Цирковые фокусы – это демонстрация принципиальных различий между тем, что мы видим и смыслом происходящего. Например, когда мы видим, как распиливают женщину, но при этом прекрасно понимаем, что никакого распиливания на деле не происходит. Здесь опять оказывается важным контекст: наверное, если бы мы увидели такое во дворе, то постарались бы воспрепятствовать жестокому убийству, но здесь же цирк, смысл которого как раз в создании иллюзий, где невозможное становится возможным.
Ещё одна проблема – экзамены. Сколько копий сломано вокруг ЕГЭ, которые, по мнению противников, вместо того, чтобы стимулировать учащихся понимать смысл того, что они проходили в школе, толкает к тупой зубрёжке, которая выветривается из головы тут же после получения отметки. Ибо, как говорил Гельвеций: «Знание некоторых принципов легко возмещает незнание некоторых фактов». Я бы выразился категоричнее: «понимание небольшого числа принципов (смыслов) перекрывает запоминание огромного числа фактов». Но как убедиться в том, что «железо», которое нам хочется видеть искусственным интеллектом, понимает смыслы, если мы не можем автоматизировать соответствующий экзамен для людей? Созывать экспертные советы, где у каждого эксперта может быть своё мнение?
Может сложиться впечатление, что я ворчливый пессимист, однако на самом деле ровно наоборот. Очевидно, что рост вычислительной производительности, объёмов хранимых данных, скорости доступа к этим данным, а также прогресс в коммуникационных возможностях позволяют распознавательным приложениям (текста, голоса, изображений и пр.) обрастать контекстом.
В качестве примера можно привести распознавание текста. Уже давно речь идёт не о распознавании отдельных символов (посимвольном) – приложение читает текст целиком, определяет язык, пытается понять структуру (таблицы, списки) и только после этого выдаёт результат.
Далее эти разросшиеся контексты вполне могут соединяться между собой, и тогда песня будет распознаваться как по словам, так и по музыке, а возможно, что и по исполнителю, аранжировке и видеоряду (если это клип). А поскольку всё это будет производиться не на относительно убогих клиентских устройствах, а в огромных ЦОДах, то количество условных нейронов там рано или поздно превзойдёт таковое в мозгу человека, при том, что объём хранимых данных уже давно превзошёл. Чего там точно не будет – так это воли, желаний, стремлений, так что восстание машин нам точно не грозит.
***
Напоследок хочу рассказать о том, что происходило в этом плане в СССР. 1975 год, предмет «Организация производства»: на перерыв внутри пары мы никогда не ходили, а после пары преподаватель нас чуть не пинками выгонял из аудитории – так нам с ним повезло. И поскольку организация производства предполагала некую формализацию и компьютеризацию, неоднократно поднимался вопрос о том, может ли машина мыслить. В свою очередь эта дискуссия требовала определиться с терминами.
Как-то наш преподаватель не выдержал и сказал слова, за которые могли и привлечь. Что, поскольку марксизм-ленинизм является единственно правильным учением, то нам положено использовать определение Маркса, которое он давал для паровой машины. А для мышления – определение мышления, данное Лениным опять же до появления всяких намёков на ИТ. Сопоставляя оба этих определения, мы легко придём к выводу о том, что машина думать не может, под общий смех закончил он. Примите это в качестве объяснения того, что в книге г-на Черняка упоминается множество выходцев с территории бывшей Российской империи или СССР, но нет ни слова о советской или российской (РФ) школе искусственного интеллекта.