Военно-карманные переводчики будущего? Часть 2

11
История шахматной мысли гласит, что каждый шахматный гений в начале пути, опираясь на свою память, аналитику и скорость мысли, быстро изучал все выигрышные партии своих выдающихся предшественников. Используя эти знания, легко побеждал более слабых соперников, а когда сталкивался с теми, кто обладал не меньшим багажом знаний и опыта, то придумывал свои личные приёмы игры, создавая свои победные партии. Но затем этот опыт приучал его действовать автоматически, пока не появлялся новый соперник, который своей личной манерой игры преодолевал победоносный опыт предыдущего чемпиона. То есть можно сказать, что на каком-то этапе своего развития, победоносный опыт шахматных чемпионов стирает ту живость мысли, которая когда-то и вывела их в чемпионы. Они продолжают играть блистательно, сложно, но в чём-то — предсказуемо... То есть в какой-то степени превращаются в конечные автоматы.





Именно это и использовали программисты шахматного суперкомпьютера. Они заложили в его программу все имеющиеся победоносные партии великих шахматных чемпионов всех времен и народов. Такой умственный багаж не под силу никакому человеческому уму, в этой же программе были заложены все известные возможные переходы от розыгрыша одной партии к другой в зависимости от действий соперника. После этого пригласили к игре чемпионов мира. И получилась игра двух конечных автоматов, только один в процессе игры способен уставать, волноваться, забывать, терять сосредоточенность, долго раздумывать, а другому всё это чуждо. Вот и "подмялся" человек машиной! Но я абсолютно уверен, что, если бы собралась группа великих шахматистов, поиграла бы с компьютерным монстром, спокойно проанализировала все свои партии и в конце концов нашла способ его обыграть, причём потом сами шахматисты удивлялись бы, сколь легко это можно было сделать, нащупав серию нестандартных комбинаций, не имевшихся в памяти компьютера. Правда, эта серия в следующей игре уже бы не помогла, ибо сразу бы вбилась в компьютерную память вместе с нужными ответными ходами, которые программисты выспросили бы у тех же шахматистов.

Осознав вышенаписанное, я приступил к знакомству с действующими методиками машинного перевода и обнаружил, как уже сказано выше, что все эти наборы взаимосвязанных программ работают приблизительно одинаково, то есть заданные им тексты они анализируют тематически, грамматически, пытаются уловить смысл отдельных фраз и связать его с традициями языка, истории и географии страны этого языка, после чего идёт основная работа по статистическому сравнению с находящимися в памяти системы ранее переведёнными текстами схожей тематики. После этого выдаётся результат, который проверяется и дорабатывается окончательно человеком-переводчиком. Результат этот тоже закладывается в память системы для помощи в переводе других текстов. Такие программы перевода можно настраивать для повышения их результативности, и чем уже специализированная тематика и выше повторяемость задаваемых текстов, тем эффективнее настраивается переводческая программа. На этой же основе были созданы и приложения для голосового общения между разноязычными людьми для переносных гаджетов, естественно, что без длительной и тщательной настройки они работать неспособны, но даже и после такой индивидуальной, тщательной и дорогостоящей настройки возможности общения будут очень ограничены: то, что сгодится для разговоров с одним собеседником или группой собеседников, может оказаться практически непригодным для других. Ну и зачем тогда платить за такие настройки? Вот и нет сейчас настоящих программ-разговорников для тех же туристов. А ведь именно такие программы, на мой взгляд, и должны стать высшим достижением для машинного перевода.

Далее я решил посмотреть, какие методы машинного перевода изобретены и запатентованы на сегодняшний день. Порылся в базе данных Роспатента и обнаружил там один-единственный патент под названием "Адаптивный машинный перевод" от 2010 года, заявка от 2004 года, за номером 2382399, патентообладатель — компания Майкрософт, США. Проштудировав патент, я увидел, что в нём изложена схема работы со статистическими и вспомогательными программами машинного перевода, имеющимися и создающимися на сегодняшний день. Именно по этой схеме работают все доступные источниковые (open source!) программы-"движки" в интернете, которые берут и настраивают для своих пользователей все компании машинного перевода в мире, одновременно и бесплатно пополняя базу данных переводческой системы самого Майкрософта.

В блок-схеме переводческого способа компании Майкрософт особый интерес у меня вызвал элемент под названием "источник надёжной информации", то есть, если пользователь работает над своим переводом, пользуясь переводческим движком, привязанным к интернету, то те куски текста или отдельные фразы, которые ещё не заложены в статистической памяти системы, отправляются ею в некий центр, где либо люди-переводчики переводят этот фрагмент, либо специалисты обрабатывают его с помощью особых программ, после чего перевод фрагмента предоставляется пользователю, одновременно оседая в базе системы. Компании редко пользуются системой перевода с выходом в интернет, чтобы не нарушить конфиденциальность своей служебной информации, да и незачем, если есть свои люди-переводчики, которые переведут фрагменты, оказавшиеся не по зубам компьютеру. А вот для рядового пользователя система с выходом в интернет в быту могла бы подойти, но, во-первых, она платная, а во-вторых, она просто зависнет и захлебнется от бесконечного и частого разнообразия запросов от индивидуальных пользователей. Её настройка на такую работу станет просто невозможной! Впрочем, она невозможна в любом случае, ибо неисправимо порочен сам статистический способ перевода. Человеческая речь слишком изменчива и непредсказуема, она тоже не вмещается в рамки конечного автомата, поэтому её статистический анализ для целей перевода всегда будет безнадёжно отставать от её развития и изменения, бесконечно требуя бесконечных вычислительных мощностей и скоростей.

Придя к такому выводу, я задался вопросом: а зачем в способах машинного перевода обязательно стараться воспроизводить полностью схему работы человеческого мозга, которая всегда будет недостижима для любого конечного автомата? Если задача для компьютера нерешаема, то, может быть, облегчить ему задачу? Смириться с мыслью, что любая, самая умная машина — всегда всего лишь помощник, но никак не равноправный партнёр, и, исходя из этого, бесконечно совершенствовать таких помощников, не ставя им запредельных задач?

Тут я снова вспоминаю пример с проигрышами чемпионов мира шахматному суперкомпьютеру... Они проиграли ему потому, что сами уподобились вольно или невольно конечным автоматам, и в этом качестве, конечно же, не могли выиграть у более мощной системы. Но там было соперничество. А что, если в машинном переводе применить такую же схему с обратным знаком? Создать сотрудничество мощного конечного автомата- исполнителя с командующим конечным автоматом, роль которого исполнит человек?

Продолжение следует…
11 комментариев
Информация
Уважаемый читатель, чтобы оставлять комментарии к публикации, необходимо авторизоваться.
  1. +5
    29 сентября 2018 06:11
    Очень интересно, но так вступительная часть явно затянулась... Будем ждать продолжения.

    Несерьёзное дополнение на субботу:
    Человеческая речь слишком изменчива и непредсказуема

    Люди меньше читают, переходят на обмен графическими символами, знания черпают из комиксов и статусов в социальных сетях. Словарный запас скоро уменьшится и необходимость в развитии систем машинного перевода исчезнет. Что сложного в переводе такой фразы: Я ты купить магазин пиво семки гы...

    А тут вообще целый диалог:
    - winked drinks love feel ?
    - sad stop crying
    - sad
    1. +3
      29 сентября 2018 06:28
      Как раз фильмец вспомнился smile
  2. +2
    29 сентября 2018 06:36
    Понравилось. Спасибо автору. Давай продолжение))
  3. 0
    29 сентября 2018 20:07
    Совершенно неверное понимание шахматной программы.
    Ну и дабы не размазывать пост приведу, что АльфаГо текущий шахматный чемпион среди программ вообще получил только правила шахматной игры ,а всё мастерство наработал в игре с самим собой, обучаясь игре. После чего продемонстрировал просто невероятный уровень игры
    1. 0
      2 октября 2018 08:21
      Цитата: BlackMokona
      ... что АльфаГо текущий шахматный чемпион среди программ вообще получил только правила шахматной игры...

      Капитан Очевидность подсказывает, что АльфаГо - программа для игры в Го.
      1. 0
        2 октября 2018 22:59
        Внезапно это самообучающаяся нейросеть которую научили ещё шахматам и сеги
        1. 0
          3 октября 2018 07:39
          Цитата: BlackMokona
          Внезапно это самообучающаяся нейросеть которую научили ещё шахматам и сеги

          Ссылку кидайте
          1. 0
            3 октября 2018 17:48
            В октябре 2017 DeepMind сообщила о появлении ещё более сильной версии AlphaGo - AlphaGo Zero

            Wiki
            И новость с обьяснениями
            https://www.chess.com/ru/article/view/kak-alphazero-ighraiet-v-shakhmaty
  4. 0
    29 сентября 2018 22:06
    Автор этой статьи = сказочник
  5. +2
    1 октября 2018 19:21
    Пушкин знал 16 тыс. слов.
    Среднестатистический выпускник средней советской школы, он же - абитуриент военного училища - примерно 2500 слов.
    Примерно, к достижению звания майор, лексикон среднестатистического офицера "оптимизировался" до 800 слов - это словарный запас Устава внутренней службы ВС СССР (армейский фольклор).
    Чтобы военно-карманный переводчик заработал, загрузите в машину Уставы.
  6. "Если хочешь жить - приведи нас к ракетной установке." (C)

    «Nimi? Otsikko? Missä on osa?
    (Имя? Звание? Где расположена твоя часть?)
    Yksityinen Haapassalo! Roth on lentokentällä!
    (Рядовой Хаапассало! Рота охраны аэродрома!)
    Jos haluat elää, saattaa meidät ohjus asennus.
    (Если хочешь жить, приведи нас к ракетной установке.)
    Meillä ei ole raketinheittimiä.
    (У нас нет ракетных установок.)