Военно-карманные переводчики будущего? Окончание

12
Пусть человек во взаимодействии с компьютером-переводчиком ограничит свои требования строгими и предсказуемыми рамками, в которых не будет места живой спонтанности, и компьютер получит комфортные условия работы, отвечающие его технической, а не живой сущности, которой в нём нет и быть не может!





Руководствуясь такой постановкой задачи, я за семь лет работы, затратив два последних года на патентование (горжусь, американцы на получение своего патента в России затратили 6 лет!), зарегистрировал летом 2017 года своё изобретение, номер патента 2628202 под названием "Адаптивный контекстно-тематический машинный перевод" (можно ознакомиться на сайте Роспатента).

В этом способе всё будет работать так. Пользователь устно или письменно задаёт переводческой системе некий текст. Система принимает его не целиком, как прежние системы, а каждое законченное предложение-фразу по отдельности, тут же начиная эту фразу переводить. На экране своего гаджета пользователь после каждой фразы своего текста видит другую фразу на своём родном языке, так называемую стандартную фразу, которую система нашла в своей памяти в качестве аналога, наиболее точно отражающего смысл того, что говорится во фразе, заданной пользователем. Наряду со стандартной фразой, на экране возникают названия тем, которые этой фразе способны соответствовать. Пользователь выбирают нужную тему и даёт команду на перевод, после чего стандартная фраза переводится точно и однозначно на иностранный язык в виде имеющейся в памяти системы на этом языке парной стандартной фразы.

Если в задаваемом тексте окажется фраза, для которой в памяти системы не имеется соответствующей стандартной фразы, то она вместе с полным текстом, который задаёт к переводу пользователь, попадает в источник надёжной информации, где компьютерные лингвисты и переводчики подбирают ей стандартный аналог и тему, делают перевод и закладывают это всё в память системы.

Если пользователь увидел на экране стандартную фразу, парную фразе заданной из текста, но не увидел среди набора тем ту, что отвечала бы смыслу фразы, то он сам набирает название нужной темы и отсылает в источник надёжной информации, а там делают соответствующий стандартный перевод фразы и тоже всё закладывают в память системы.

Так она беспрерывно пополняется, обогащается и самообучается. И будет вполне годиться для работы с гаджетами обычных индивидуальных пользователей, именно на них она прежде всего и рассчитана.

Но профессиональным переводчикам она тоже способна облегчить работу гораздо рациональнее статистических систем перевода. Вот как это будет выглядеть.

Переводчик даёт сигнал системе: "Работает профессионал"! После этого запускает свой текст, смотрит на экран, выбирает темы для стандартных фраз и даёт команды на перевод. После того, как получает всё, что системе удалось перевести, сам переводит фразы, которые система не смогла осилить. Затем окончательный перевод всего текста посылает системе в источник надёжной информации, где это соответственно обрабатывается и закладывается в систему. После чего переводчик, если ему это нужно, требует от системы, чтобы она перевела этот текст ещё на несколько других языков. А система это сделает буквально мгновенно, ибо у каждого предложения в тексте уже однозначно подобраны парные стандартные фразы и соответствующие им темы, так что "думать" не надо, только чистый поиск-перебор по базам данных.

Если не особо вникать, то может возникнуть вопрос: чем моё предложение лучше статистического метода, если принципиальная проблема вечных догонялок за живой речью никуда не исчезла? Формально всё так и есть. Но я исходил из того, что, когда простые разноязычные люди общаются между собой, то делают это обычно недолго и поверхностно, как временные и случайные знакомые, да ещё и достаточно торопливо. Они жаждут донести друг другу короткую точную информацию с небольшим набором тем, и в этом случае моё предложение будет вполне работоспособно и востребованно. Особенно когда люди привыкнут работать с этой системой. Я больше чем уверен, что они с удовольствием начнут запоминать стандартные фразы из системы, чтобы не ждать их подбора, если сказанная фраза нестандартна. Среди молодёжи разговор стандартными фразами, которые гаджет способен сразу же перевести на другой язык, может стать модой, трендом, мейнстримом или как они ещё это по-своему называют.

Тут же встаёт вопрос: что должно стать речевой основой для будущих стандартных фраз в системе контекстно-тематического перевода? Я считаю, что речевой основой стандартных фраз в компьютерной системе контекстно-тематического перевода должен стать язык классической литературы всех языков мира. И я предлагаю это отнюдь не из морально-воспитательных или эстетических соображений, а чисто практически. Классическая речь легко усваивается, отлично понимается носителями языка и быстро, точно, немногословно переводится на иностранную литературно-классическую речь. Данный способ машинного перевода прежде всего предназначен для непосредственного общения разноязыких людей между собой. И если он будет удачно реализован, то это должно резко увеличить потоки во всех видах международного туризма. Таким образом, операторам туристического бизнеса есть прямой резон помочь во внедрении этого метода, причём самой массового и несложного его сегмента, который станет фундаментом для дальнейшего и более глубокого развития таких систем машинного перевода.

Этот же фундаментальный сегмент будет иметь серьёзное военно-прикладное значение, ибо самые первые карманные переводчики появились как раз в армии, точнее, в армии США на территории Ирака где-то в 2003 году. Это были примитивные голосовые гаджеты, на которые записаны тематические наборы стандартных команд и фраз с голосовым переводом на арабский для самого простого общения с местным населением, полицией и военными. Эти разговорные наборы были сделаны по типу разговорников, имеющихся в книжечках-путеводителях для туристов, которые и сейчас можно приобрести перед путешествием в любые страны. Кстати!! Именно путеводительские разговорники с их простыми, но необходимыми путешественнику стандартными фразовыми парами "фраза-перевод", распределёнными по темам, чтобы легко было найти в книжечке, и подсказали мне то направление, в котором, на мой взгляд, следует организовывать и развивать системы именно разговорного машинного перевода!

Так вот... Наша армия всё больше втягивается в международные операции по подавлению терроризма, где-то наши военные выполняют миротворческие функции, поэтому им совершенно необходимы возможности легко общаться с местными администрациями и населением. Посему я считаю, что данный метод будет наиболее подходящим для них, ибо быстр и лёгок в освоении, а также отлично поладит с той служебной и бытовой лексикой, которой приучены пользоваться военные. А приучают военных к такой лексике, краткой, ёмкой, передающей самую суть сообщений, прежде всего требования устава, пример языка, которым он написан. Вот я и считаю, что при разработке системы контекстно-тематического перевода, особенно на самых первых этапах, следует создать речевой функционал, похожий на армейский устав, который бы содержал чёткие требования и примеры по выработке стандартных фраз, закладываемых в глоссарии памяти системы.

Теперь о технических преимуществах контекстно-тематического перевода. Прежде всего это резкое упрощение программного обеспечения. Вместо сложнейших программ статистического анализа, поиска, сравнения на первый план выходят несложные программы простого сравнительного поиска-перебора в базах данных. А это даст, на мой взгляд, не только новое качество перевода, но и огромную экономию вычислительных мощностей вместе с экономией электроэнергии. Ведь, по сведениям директора Курчатовского института М. Ковальчука, один простой голосовой запрос со смартфона "жрёт" энергии столько, что можно литр воды вскипятить, а треть всего электричества в США уходит на работу дата-центров одного только Гугла!!

Из аналитических программ на первый план выйдут программы морфологического и синтаксического анализа для помощи персоналу источников надёжной информации, чтобы оперативно согласовывать все эти спряжения, времена, падежи, знаки препинания и т. д. А эти программы тоже не бог весть какие тяжкие. Предвижу, что по мере развития систем контекстно-тематического перевода найдут себе применение и другие виды программ, которые сейчас уже разработаны и действуют в машинном переводе, но думаю, что они будут приспособлены на несколько других принципах, начнут работать эффективнее, точнее, экономнее используя вычислительные мощности систем машинного перевода.



P. S. Хочу добавить, что в рамках информации, которую полагается давать в патентной документации, просто невозможно изложить всё, что составляет полную суть изобретения и способы его реализации. Поэтому команде, которая приступит к воплощению данного проекта в жизнь, я смогу сообщить немало того, что сможет значительно сэкономить их время, ресурсы и, главное, интеллектуальные усилия.

P. P. S. В комментариях к предыдущим частям моей статьи было высказано, что большинство ошибок голосовые переводчики делают за счёт системы распознавания голосов пользователей, а если фразы просто набирать на смартфонах письменно, то качество перевода резко улучшается, особенно в Гугле. Ну, во-первых нас интересовали именно возможности голосовых переводчиков для общения наших санитарок и медсестер с инопациентами. Во-вторых, мы использовали переводческие приложения, где на экране смартфона сказанная голосом фраза сначала появляется в письменном виде, её можно прочитать, а потом дать команду на голосовой перевод. Гугл транслейтер тоже опробовали, в нашем случае он оказался ничем не лучше всех прочих. После этих испытаний у нас в Центре антропометрической (ортопедической) косметологии и коррекции появилось постоянное развлечение: периодически собираются группки из русских и иностранных пациентов вместе с незанятыми санитарками или медсёстрами, достают свои гаджеты и пытаются с их помощью разговаривать с иностранцами. Хохот при этом стоит просто истерический, особенно если среди наших пациентов есть ребята с хорошим английским или ещё каким-то языком, которые могут растолковать, как должна была перевестись фраза и как её в натуре перевёл гаджет. Таким образом я имею возможность тестировать все системы нынешнего компьютерного перевода практически постоянно.
12 комментариев
Информация
Уважаемый читатель, чтобы оставлять комментарии к публикации, необходимо авторизоваться.
  1. +5
    6 октября 2018 06:21
    Среди молодёжи разговор стандартными фразами, которые гаджет способен сразу же перевести на другой язык, может стать модой, трендом, мейнстримом или как они ещё это по-своему называют.

    В результате мы будем общаться примерно так:
    - Я ходить магазин два часа будущее.
    - Удивление. Я думать ты ходить магазин прошлое.
    - Я спать. Опоздание.
    Я считаю, что речевой основой стандартных фраз в компьютерной системе контекстно-тематического перевода должен стать язык классической литературы всех языков мира.

    Тут одно из двух, или стандартные фразы или всё богатство языка.

    Предлагаемый автором вариант обучения системы перевода напоминает ВИКИ. Идея хорошая, но результат не впечатляет.
    Вот я и считаю, что при разработке системы контекстно-тематического перевода, особенно на самых первых этапах, следует создать речевой функционал, похожий на армейский устав, который бы содержал чёткие требования и примеры по выработке стандартных фраз

    Так не проще ли перейти на иероглифы? Вот вам набор из 2000 знаков, комбинируя которые можно полноценно общаться. Каждому иероглифу подобрать значение в языке и всё. Ещё проще - не иероглифы, а цифры. И разговор многоязычной компании будет таким, как в анекдоте

    -В который раз собирается одна и та же компания. Все анекдоты уже рассказаны, поэтому в компании решают рассказывать анекдоты по номерам. Вот сидят они, перешучиваются:
    — Анекдот №325!
    — Ха-ха-ха!
    — Анекдот №719!
    — Ха-ха-ха!
    — Анекдот №18!
    — Ха-ха-ха!
    — Анекдот №133!
    — Ха-ха-ха!
    Тут один из компании начинает громко хохотать, кататься по полу, никак не может остановиться.
    — Что это с тобой?
    — Я этот анекдот ещё не слышал!
    1. +2
      6 октября 2018 06:35
      ..... good ..Опередили... smile
    2. Комментарий был удален.
  2. +7
    6 октября 2018 06:56
    Михаил Гольдреер
    Не в обиду автору хорошо известному на сайте, но это очередная статья для саморекламы. Я, мое, патент...
    1. +7
      6 октября 2018 08:42
      Не в обиду никому, скажу, человек хоть что-то сделал. Согласен, критика это тоже хорошо. Благодаря ей, можно увидеть, то что не доглядел. Жаль, что примеров перевода нет, поэтому можно только гадать, как это изобретение должно на самом деле работать, но сейчас я о другом. Что плохого в саморекламе? Может у автора этой статьи не так много времени и он общается всего на нескольких площадках, а написание статьи само по себе забирает прилично времени.. Может было достаточно поблагодарить за труд, который в ближайшем будущем получит объективную оценку? ИМХО.
  3. +3
    6 октября 2018 10:30
    Человек предлагает вернутся на два поколения назад в переводчиках.
    Предлагаемый тип давно устаревшая технология. Которую как раз и заменили переводчики на статистических моделях, а их уже активно заменяют нейронные сети.
    1. 0
      16 октября 2018 08:41
      согласен, но нейронные сети это тупиковый путь, я их ввел в эти системы, и у меня украли "идею", но украли идею неработоспособную и пусть ломают копья, ибо ничего не смыслят, а я посмеюсь над ними
  4. +1
    7 октября 2018 06:45
    Прочитал статью и вспомнил, как нас в военном инженерном училище гоняли на кафедре иностранного языка. Малейшая заминка в переводе и отправляешься в конец очереди. Все эти огромные тексты, допросы военнопленного и т. д. на службе не пригодились и многое, почти за сорок лет, забылось. Что касается статьи, то думается, что такие карманные переводчики со временем появятся в войсках. Очень удобная штука.
  5. +2
    8 октября 2018 10:43
    Мой дед - обычный пехотный капитан 1-го Белорусского фронта, комбат, в ту войну прекрасно обходился всего несколькими фразами - "Хальт, хенде хох, цурюк, шнапс" и ему их вполне хватало... laughing
  6. 0
    9 октября 2018 21:41
    по сведениям директора Курчатовского института М. Ковальчука, один простой голосовой запрос со смартфона "жрёт" энергии столько, что можно литр воды вскипятить, а треть всего электричества в США уходит на работу дата-центров одного только Гугла!!
    Самая большая сейчас батарея в смартфоне это 6-8 тыс мА/ч. А что бы вскипятить литр воды нужен как минимум 700 Вт чайник (самый дешевый), и путем не хитрых вычислений, мы узнаем что мы едва только подогреем водичку. А 1/3 всего вырабатываемого электричества. То есть ни заводы, ни освещение, и вообще потребители... Что за бред?
    1. 0
      11 октября 2018 07:53
      Может быть речь идёт о полном цикле обработки запроса?
  7. 0
    16 октября 2018 08:37
    давно и нтересуюсь этой темой.....олнако патент меня разочаровал, до глубины души, моя покойная мама разработавшая сверсекретные алгоритмы для ПЛ много лет назад, столконулась на зашите диссертации с пиплом, считавшим что для упрошения программы можно что то там сделать.....ну а ручными методами доделать. Поймите запомните "эффективная прорамма обязана работать надежно, и без человеческого участия!". Если трудности решает оператор то програама неудачная, слабая и просто нереализуемая, откуда возьмутся ваши эксперты? кто им будет платить?...и Вы пишете про упрощения программного обеспечения......!!!!! Поймите компьютер железный пусть работает, он создан для того чтобы оперваторы отдыхали, а не наоборот. Что вы понимаете под сложностью алгоритма? Количество строк? Интеллектуальность логики? Что такое сложное бывает в жизни? И чем сложное отличается от простого? Сложное отличается от простого только степенью незнания конкретного человека.
  8. 0
    7 декабря 2018 11:07
    Не скажу за карманные переводчики, но вот принципиальный изъян электронных переводчиков очевиден: сведение к однозначности. Мыла покрывала... чем? Порошком или крышкой? В первом случае "мыла" глагол, а "покрывала" существительное; во втором "мыла" - мн. ч. от "мыло", а "покрывала" глагол.
    Пусть пример искусственный, но подобное встречается тут и там, часто влияя на согласование. Из чего следует, что хороший автоматический переводчик принципиально невозможен.
    Возможен лишь полуавтоматический, когда пользователю предлагается на выбор несколько значений слов и различные возможные сочетания связей.
    Сделать такое в общем-то проще простого. Но на пути стоит (вы будете смеяться) текстовость формата. Хороший переводчик будет вместо конкретного результата выдавать списки возможных слов; нужен только удобный механизм для работы с такой структурой, чтобы постепенно с помощью простых выборов превратить ее в осмысленный текст. И сделать-то это средствами, скажем, HTML проще простого. Но вот разработчики уперлись: переводчик должен выдавать только готовый результат! Как объявил один из знакомых бравого солдата Швейка: всё или ничего! "Ну и получил ничего", - пояснил Швейк.