![]()
| ЕЖЕДНЕВНЫЕ ОБЗОРЫ ИНТЕРНЕТА ПОД РЕДАКЦИЕЙ АНТОНА НОСИКА |
|
|
| НОМЕР 333 | ИЗДАЕТСЯ NETSKATE | 6 ДЕКАБРЯ 1997 г. |
|
|
|
Заметка триста тридцать третья
|
Еще полтора года назад, когда я впервые писал репортаж об игрушке Пакина, у меня не было сомнений, что рано или поздно такое же приспособление заговорит на русском языке. Однако перед создателями русских текстовых генераторов и роботов стоят проблемы чисто лингвистического порядка, от которых заморские коллеги счастливо избавлены благодаря отсутствию у большинства английских слов категорий рода и полному отсутствию в этом языке падежей как класса. Выяснение пола заглавного героя будущей жалобы нужно Пакину только для того, чтобы сделать выбор между парами he/his/him и she/her в тех местах, где речь идет о качествах или поступках персонажа. В остальном, как свидетельствует опубликованная у Пакина статистика контекстонезависимой грамматики, он волен складывать фразы жалобы из огромного числа мелких, взаимозаменимых и легко переставляемых лексических блоков (в том числе, глаголов, прилагательных и причастий, форма которых не меняется ни по родам, ни по падежам, ни даже по числам).
Для того, чтобы грамотно работал генератор русского текста, нужно либо начинить его конечным числом готовых фраз (с последующей их рекомбинацией), либо написать алгоритм управления падежами, родами и числами для существительных, прилагательных и глаголов по отдельности. Первая задача ограничивает возможности скрипта, вторая многократно усложняет задачу программиста. Даже те генераторы русского текста, которые пишутся на коммерческой основе большими коллективами профессиональных авторов, с опорой на электронные словари, весьма несовершенны, и выдают в основном совершенно безграмотные, корявые и неудобочитаемые тексты. Что уж говорить о любительских игрушках, создатели которых не имеют возможности выстроить серьезную лексическую базу для своих программ - чисто в силу неподъемности задачи.
Тем не менее, попытки создать русский текстовый генератор, время от времени делаются. И, как свидетельствует "Робот Сергей ДацюкTM", они зачастую оказываются вполне успешны. Впрочем, о сроках превращения текстуальных игр в полноценный рабочий инструмент говорить пока рано - причем как для русскоязычных программ, так и для английских. Когда разработки в области искусственного интеллекта зайдут достаточно далеко, то очень легко может выясниться, что гуманитарным роботам просто не находится полезного коммерческого применения. Впрочем, по моему личному ощущению, сегодня об этом задумываться еще слишком рано. Подождем, пока робот сгенерирует русский текст, неотличимый от авторского. "Робот Сергей ДацюкTM" от подобного результата еще весьма далек. Вот сгенерированный наугад образец его творчества:
Поэтому идеология Microsoft представляется более концептуальной и имеющей отдаленную перспективу, в то время как в России, так в Украине, так и не мотивировали отказ. Я не пытался противостоять, но в принципе не можем знать о том, что говорить этими словами, как это делала Катя. Она даже провокации устраивала, говоря сначала лестно и вроде как поменьше, а о свободе слова, речь идет не о традиционном психоанализе, где бессознательное соотносится с сознанием в рациональном подчинении иррационального. Речь идет о той самой полифонии культур, о которых есть во множестве связанных между собой структуры личности разрушаются, слетают, осыпаются как шелуха. Остается одно - насколько быстро земляне успеют отказаться от антисоциальной и идеологически и отстаиваешь.
Как мы видим, с наукообразием тут все обстоит хорошо, а над складыванием лексических блоков в связные фразы создателям робота еще придется поработать...
В заключение - несколько слов на совершенно другую тему. Программа ICQ89A вышла официально. Причем сразу в пяти разновидностях:
Предостережение: сервер tucows.rinet.ru не поддерживает HTTP restart. Поэтому если вы хотите качать с него файлы в несколько приемов, это можно сделать по FTP, подключившись по адресу:
ftp://kucha.rinet.ru/pub/tucows/files/
ftp://kucha.rinet.ru/pub/tucows/files2/
Обратите внимание, что файл, который вы начинали скачивать с одного сервера, можно совершенно спокойно докачать с другого - разумеется, при условии, что речь идет об одном и том же файле, а не о разных версиях с одинаковым названием, как у Оперы. Можно, например, сгрузить часть файла по FTP через бродилку, а остальное докачать по http через ReGet. Или наоборот - начинать скачивать по http, а продолжить с помощью CuteFTP с любого места (при условии, что у вас не истек 30-дневный срок бесплатного этой программы, после которого она перестает поддерживать функцию restart).
|
Copyright © 1997 NetSkate Inc. Copyright © 1997 Антон Носик Дизайн - Артемий Лебедев |
![]() |