MyMonster - пренаписвач за RU

MyMonster пренаписване на текстове, чиято основна разлика от стотици други е, че абсолютно всички думи остават на местата си без замяна, а уникалността се придава чрез въвеждане на нови думи в текста, които по един или друг начин качествено характеризират различни части на речта.

MyMonster съдържа основите:

  • Основни прилагателни - 27840 прилагателни и 22 висококачествени наречия, съчетани с прилагателни
  • Основни глаголи - 3228 глагола и 31 качествени наречия, които се комбинират с глаголи
  • Базови комбинации - 3337 реда, 2-5 правилни комбинации от руски думи

Сценарий MyMonster има 3 полета - отгоре, средно, отдолу. Най-горното поле е за въвеждане на текст. Средните и долните полета се използват за визуално сравняване на текст преди и след пренаписване.

Работата е свършена

  • 1. Анализирани са 50 GB руски текст и 47 GB английски текст.
  • 2. Разработен е уникален алгоритъм за разпознаване на части от речта.
  • 3. С помощта на алгоритъма за разпознаване на част от речта бяха обработени анализирани текстове.
  • 4. Разработени са леми и честоти. Лема - отношението на думата към определена част от речта. Честота - повторение на дума на 100 000 думи.
  • 5. Коефициентът D е въведен като отношение на лемата към честотата.
  • 6. В речниците са включени само думи с коефициент D над 0,5.
  • 7. Прилагателните и глаголите са изгонени във всички случаи и времена.
  • 8. Думите с двойно значение бяха елиминирани.

Кратък, но показателен пример на руски език

Можем с увереност да кажем, че новият текст е много по-четлив в литературен смисъл от самия източник.

И е много важно да не е имало глупави замествания, като например купуваш, купуваш, скъпи-скъпи, подарък-подарък и т.н.

Основни подобрения:

  • Функция "Начални изречения"
  • Функция "Събития"
  • Функция празници
  • Функция "Изявления"
  • Функция "Хороскопи"
  • Функция "Анекдоти"
  • Функция на пословиците

За тази актуализация бяха намерени десетки източници на съдържание, за всеки източник беше написан парсер. Основите бяха сглобени на ръка.

Въвеждането на която и да е функция в текста добавя от 1 до 3% уникалност с дължината на херпес зостер = 5. И тогава всичко това се наслагва върху глаголи, прилагателни, синоними и всичко останало, което вече е било в чудовището.

Начало на изреченията

Всички "изкривявания" на текстове страдат от една често срещана болест - проблемът с подмяната на думите на кръстовището на изреченията. Разбира се, този проблем може да бъде решен чрез смесване на изречения.