Skip to content

Commit

Permalink
Some new test code
Browse files Browse the repository at this point in the history
  • Loading branch information
Vuizur committed Mar 14, 2023
1 parent f48c240 commit afba985
Showing 1 changed file with 6 additions and 0 deletions.
6 changes: 6 additions & 0 deletions russian_text_stresser/test_other_systems.py
Original file line number Diff line number Diff line change
Expand Up @@ -14,10 +14,16 @@ def test_russtress():
22 октября 2020 разработчики из Сбера объявили о создании русскоязычного аналога GPT-3. Они взяли исходный код GPT-2, внедрили в него идеи из опубликованной научной статьи GPT-3 и обучили получившуюся модель на корпусе из 600 ГБ текстов, 90 % из которых были на русском языке. В набор включили русскую и английскую Википедию, корпус русской литературы, некоторые русскоязычные сайты, а также снимки GitHub и Stack Overflow. Модель, которую они назвали ruGPT-3 Large, содержит 760 млн параметров[30]. В дальнейшем разработчиками были выложены версии модели на 1.3 млрд параметров (ruGPT-3 XL) и на 13 млрд параметров (ruGPT-3 13B).
"""

text = "У нашей девочки не было старой обуви на красных от холода ножках, не было старых перчаток на синих от холода ручках, и она ничего ни у кого не просила белыми от холода губами."

if __name__ == "__main__":
#accentor = Accentor()

text_stresser = RussianTextStresser()

stressed_text = text_stresser.stress_text(text)
print(stressed_text)
quit()
# Transliterate text to latin
latin_text = transliterate.translit(TEST_TEXT, reversed=True)
print(latin_text)
Expand Down

0 comments on commit afba985

Please sign in to comment.