Samara Portal Technology, Computers

Самарский портал "Технологии, компьютеры"

Именно такой подзаголовок хочется дать книге Леонида Черняка «Путеводитель по истории Искусственного Интеллекта». Работа фундаментальная, кажется, упомянуто всё, что хоть как-то можно связать с этим понятием. Собственно, и начинается книга с раздела «О названии, терминологии и дискурсивных полях», где предпринимается попытка договориться о самом термине, который, по мнению автора, извратили при переводе: «английское artificial с русским «искусственный» близки, но они далеко не тождественны. Подавляющая часть значений английского artificial (от art – искусство, мастерство), так или иначе, связана с понятием «рукотворный», а в русском, как утверждают лингвисты, слово искусственный ведёт происхождение из немецкого künstlich, значащего, скорее, поддельный».

Собственно, эти рассуждения, аргументированные огромным количеством цитат великих (пусть в своей узкой области, но зато эта область сегодня едва ли не важнейшая), и составляют, на мой взгляд, главную ценность книги.

Надо сказать, что моё понимание ИИ (буду использовать традиционную русскую аббревиатуру) было другим, и точно более негативным, поскольку я видел в нём главным образом некое мошенничество.

Здесь же самые интересные места были про извлечение смысла. Что это такое, я как тот экскурсовод в анекдоте про «на всякий случай», объяснить в двух словах не смогу, но на примерах сумею показать. Эти примеры из журнала «Компьютерра» – с удовольствием бы дал ссылки на оригинальные статьи, но, к сожалению, не могу вспомнить ни авторов, на названия, а помню только… ну да, тот самый смысл.

Первая статья о том, что на самом деле мы «видим мозгом» не то, что видим глазами, потому что на автомате дополняем реально увиденное своими знаниями о предметах. Возможно, это же касается и других органов чувств, но насчёт зрения – это точно.

В погоне за ускользающим смыслом. Статья Владислава Боярова.17.12.2021 г.

Так вот, автор той статьи предложил читателям сказать, что они видят на этом изображении.

Потом на вот этом. В журнале они были на разных страницах, надо было перелистывать, здесь же у нас есть возможность открывать рисунки по клику мышки.

В погоне за ускользающим смыслом. Статья Владислава Боярова.17.12.2021 г.

Наконец, когда читатель уже сдался в попытках угадать, на последней странице статьи была напечатана картина целиком, и в контексте картины уже ни у одного человека не может возникнуть сомнений о том, что же изображено на фрагментах. Отсюда становится ясно, что никакая программа распознавания образов, натасканная на сопоставление этих объектов с теми, на которых проводилось её обучение, никогда не сможет указать, что на второй картинке изображена лошадь, и, если так можно выразиться, с большим запасом не распознает на первой картинке голову лошади. Да и вагон на вагон не сильно похож,

В погоне за ускользающим смыслом. Статья Владислава Боярова.17.12.2021 г.

и окно на окно.

В погоне за ускользающим смыслом. Статья Владислава Боярова.17.12.2021 г.

И только всё вместе, в едином контексте приобретает смысл.

Второй пример чисто умозрительный. В нём автор рассматривает работу переводчика и утверждает, что переводчик сначала должен понять смысл написанного, и только после этого найти подходящие слова для донесения этого смысла до целевой аудитории. Венчало статью изумительное рассуждение о том, что если (или когда – тут точно не помню) таковой переводчик появится, не удивляйтесь, прочитав на экране сообщение: «с текстом я разобрался, но извини, тебе этого всё равно не понять».

Как сказал поэт «смешно, да не до смеха». Однажды при переводе английского текста мне встречается бессмысленная фраза – «а эти ребята научились хранить данные с помощью известняка (limestone)». Если бы это был кремний, то понятно было бы образное выражение – но какое отношение к хранению данных имеет известняк? Лезу на сайт компании, о которой шла речь, и нахожу, что один из своих ЦОДов они разместили в известняковых штольнях! Да, я потратил время, но вскоре я увидел другой материал, переведённый человеком, в совершенстве знающий английский и свободно на нём разговаривающим. В том английском тексте было слово «mine», которое он перевёл как «карьер». В отличие от штолен, карьер является открытой выработкой, и устанавливать в нём сервера никто бы не стал. Получается, что здесь надо понимать и способы добычи камня, и преимущества установки оборудования в толще породы.

Наверное, самой большой проблемой является отсутствие универсального языка смыслов, что-то вроде эсперанто, «общего знаменателя», к которому можно привести все явления, события, изображения и прочие сущности. Частично нам это всё же удаётся, и это наглядно демонстрирует число. «Пять», «5», «V» - смысл любого из этих символов нам понятен – это число 5, выраженное «прописью», арабской или римской цифрой. Но, к сожалению, это частный случай.

Цирковые фокусы – это демонстрация принципиальных различий между тем, что мы видим и смыслом происходящего. Например, когда мы видим, как распиливают женщину, но при этом прекрасно понимаем, что никакого распиливания на деле не происходит. Здесь опять оказывается важным контекст: наверное, если бы мы увидели такое во дворе, то постарались бы воспрепятствовать жестокому убийству, но здесь же цирк, смысл которого как раз в создании иллюзий, где невозможное становится возможным.

Ещё одна проблема – экзамены. Сколько копий сломано вокруг ЕГЭ, которые, по мнению противников, вместо того, чтобы стимулировать учащихся понимать смысл того, что они проходили в школе, толкает к тупой зубрёжке, которая выветривается из головы тут же после получения отметки. Ибо, как говорил Гельвеций: «Знание некоторых принципов легко возмещает незнание некоторых фактов». Я бы выразился категоричнее: «понимание небольшого числа принципов (смыслов) перекрывает запоминание огромного числа фактов». Но как убедиться в том, что «железо», которое нам хочется видеть искусственным интеллектом, понимает смыслы, если мы не можем автоматизировать соответствующий экзамен для людей? Созывать экспертные советы, где у каждого эксперта может быть своё мнение?

Может сложиться впечатление, что я ворчливый пессимист, однако на самом деле ровно наоборот. Очевидно, что рост вычислительной производительности, объёмов хранимых данных, скорости доступа к этим данным, а также прогресс в коммуникационных возможностях позволяют распознавательным приложениям (текста, голоса, изображений и пр.) обрастать контекстом.

В качестве примера можно привести распознавание текста. Уже давно речь идёт не о распознавании отдельных символов (посимвольном) – приложение читает текст целиком, определяет язык, пытается понять структуру (таблицы, списки) и только после этого выдаёт результат.

Далее эти разросшиеся контексты вполне могут соединяться между собой, и тогда песня будет распознаваться как по словам, так и по музыке, а возможно, что и по исполнителю, аранжировке и видеоряду (если это клип). А поскольку всё это будет производиться не на относительно убогих клиентских устройствах, а в огромных ЦОДах, то количество условных нейронов там рано или поздно превзойдёт таковое в мозгу человека, при том, что объём хранимых данных уже давно превзошёл. Чего там точно не будет – так это воли, желаний, стремлений, так что восстание машин нам точно не грозит.

***

Напоследок хочу рассказать о том, что происходило в этом плане в СССР. 1975 год, предмет «Организация производства»: на перерыв внутри пары мы никогда не ходили, а после пары преподаватель нас чуть не пинками выгонял из аудитории – так нам с ним повезло. И поскольку организация производства предполагала некую формализацию и компьютеризацию, неоднократно поднимался вопрос о том, может ли машина мыслить. В свою очередь эта дискуссия требовала определиться с терминами.

Как-то наш преподаватель не выдержал и сказал слова, за которые могли и привлечь. Что, поскольку марксизм-ленинизм является единственно правильным учением, то нам положено использовать определение Маркса, которое он давал для паровой машины. А для мышления – определение мышления, данное Лениным опять же до появления всяких намёков на ИТ. Сопоставляя оба этих определения, мы легко придём к выводу о том, что машина думать не может, под общий смех закончил он. Примите это в качестве объяснения того, что в книге г-на Черняка упоминается множество выходцев с территории бывшей Российской империи или СССР, но нет ни слова о советской или российской (РФ) школе искусственного интеллекта.

----

Галопом по вычислительным Европам. Часть 2. Пути повышения IPC.

Галопом по вычислительным Европам. Часть 3. Оптимизация.

Галопом по вычислительным Европам. Часть 3. Оптимизация. Статья Ильи Вайцмана. 20.01.2023 г.

Галопом по вычислительным Европам. Часть 4. Как накормить процессор.

Галопом по вычислительным Европам. Часть 4. Как накормить процессор. Статья Ильи Вайцмана. 25.01.2023 г.

Blood, Sweat & Tears, или Кровь, пот и слёзы – часть третья, объединительная

Про верных русланов и их потомков

Про верных русланов и их потомков. Статья Владислава Боярова. 11.05.2022 г..