This word does not exist

Нейросеть научили создавать несуществующие слова и давать им определения

Время на прочтение
2 мин

Количество просмотров 10K

Томас Димсон, программист, создавший приложение Hyperlapse для Instagram, представил свой новый проект под названием This Word Does Not Exist. Проект представляет собой нейросеть, которая придумывает несуществующие слова и даёт им определения.

Как поясняет сам Томас Димсон, This Word Does Not Exist является вариацией нейросети GPT-2. Она составляет слова с нуля и даёт им пояснения и примеры употребления. Например, придуманное нейросетью существительное incromulentness образовано от неологизма cromulent, которое впервые появилось в серии мультсериала «Симпсоны» в 1996 году и переводится как «адекватный, приемлемый, правильный». Слово incromulentness, по мнению нейросети, означает «отсутствие искренности или прямоты». В качестве примера нейросеть приводит фразу Incromulentness in the manner of speech — «неискренность в манере речи».

Демо-версия проекта есть на одноимённом сайте. Существует также твиттер-бот проекта. Кроме того, на GitHub можно скачать предварительно обученную модель. Чтобы натренировать свою нейросеть на основе загруженных файлов, Димсон рекомендует воспользоваться контентом Apple Dictionary или Urban Dictionary.

Правда, пользователи YCombinator уже заметили, что This Word Does Not Exist иногда предлагает уже существующие слова — например, refactoring. Некоторые слова являются немного изменёнными существующими словами — например, intermodulate — или словами, написанными с ошибкой (disaproval). С другой стороны, нейросеть даёт своё собственное пояснение к каждому слову. Например, слово disaproval она объясняет как the action of expending money for a period of time («процесс траты денег за определённый период времени»). Второе значение, которое предлагает нейросеть, одинаково для каждого слова и поясняет его происхождение — a word that does not exist; it was invented, defined and used by a machine learning algorithm («слово, которого не существует; его изобрёл и использовал алгоритм машинного обучения»).

Word Does Not Exist Logo

This Word Does Not Exist

This is a project allows
people to train a variant of GPT-2 that makes
up words, definitions and examples from scratch.

For example

incromulentness (noun)

lack of sincerity or candor

«incromulentness in the manner of speech»

Check out https://www.thisworddoesnotexist.com as a demo

Check out https://twitter.com/robo_define for a twitter bot demo

Generating Words / Running Inference

Python deps are in https://github.com/turtlesoupy/this-word-does-not-exist/blob/master/cpu_deploy_environment.yml

Pre-trained model files:

  • Blacklist: https://storage.googleapis.com/this-word-does-not-exist-models/blacklist.pickle.gz
  • Forward Model (word -> definition): https://storage.googleapis.com/this-word-does-not-exist-models/forward-dictionary-model-v1.tar.gz
  • Inverse model (definition -> word): https://storage.googleapis.com/this-word-does-not-exist-models/inverse-dictionary-model-v1.tar.gz

To use them:

from title_maker_pro.word_generator import WordGenerator
word_generator = WordGenerator(
  device="cpu",
  forward_model_path="<somepath1>",
  inverse_model_path="<somepath2>",
  blacklist_path="<blacklist>",
  quantize=False,
)

# a word from scratch:
print(word_generator.generate_word())

# definition for a word you make up
print(word_generator.generate_definition("glooberyblipboop")) 

# new word made up from a definition
print(word_generator.generate_word_from_definition("a word that does not exist")) 

Training a model

For raw thoughts, take a look at some of the notebooks in https://github.com/turtlesoupy/this-word-does-not-exist/tree/master/notebooks

To train, you’ll need to find a dictionary — there is code to extract from

  • Apple dictionaries in https://github.com/turtlesoupy/this-word-does-not-exist/blob/master/title_maker_pro/dictionary_definition.py (e.g. /System/Library/Assets/com_apple_MobileAsset_DictionaryServices_dictionaryOSX/).
  • Urban dictionary in https://github.com/turtlesoupy/this-word-does-not-exist/blob/master/title_maker_pro/urban_dictionary_scraper.py

After extracting a dictionary you can use the master training script: https://github.com/turtlesoupy/this-word-does-not-exist/blob/master/title_maker_pro/train.py. A sample recent run is https://github.com/turtlesoupy/this-word-does-not-exist/blob/master/scripts/sample_run_parsed_dictionary.sh

Website Development Instructions

cd ./website
pip install -r requirements.txt
pip install aiohttp-devtools 
adev runserver

Нейросеть научили создавать несуществующие слова и давать им определения +12

Машинное обучение, Искусственный интеллект, Алгоритмы


Рекомендация: подборка платных и бесплатных курсов Python — https://katalog-kursov.ru/

Томас Димсон, программист, создавший приложение Hyperlapse для Instagram, представил свой новый проект под названием This Word Does Not Exist. Проект представляет собой нейросеть, которая придумывает несуществующие слова и даёт им определения.

Как поясняет сам Томас Димсон, This Word Does Not Exist является вариацией нейросети GPT-2. Она составляет слова с нуля и даёт им пояснения и примеры употребления. Например, придуманное нейросетью существительное incromulentness образовано от неологизма cromulent, которое впервые появилось в серии мультсериала «Симпсоны» в 1996 году и переводится как «адекватный, приемлемый, правильный». Слово incromulentness, по мнению нейросети, означает «отсутствие искренности или прямоты». В качестве примера нейросеть приводит фразу Incromulentness in the manner of speech — «неискренность в манере речи».

Демо-версия проекта есть на одноимённом сайте. Существует также твиттер-бот проекта. Кроме того, на GitHub можно скачать предварительно обученную модель. Чтобы натренировать свою нейросеть на основе загруженных файлов, Димсон рекомендует воспользоваться контентом Apple Dictionary или Urban Dictionary.

Правда, пользователи YCombinator уже заметили, что This Word Does Not Exist иногда предлагает уже существующие слова — например, refactoring. Некоторые слова являются немного изменёнными существующими словами — например, intermodulate — или словами, написанными с ошибкой (disaproval). С другой стороны, нейросеть даёт своё собственное пояснение к каждому слову. Например, слово disaproval она объясняет как the action of expending money for a period of time («процесс траты денег за определённый период времени»). Второе значение, которое предлагает нейросеть, одинаково для каждого слова и поясняет его происхождение — a word that does not exist; it was invented, defined and used by a machine learning algorithm («слово, которого не существует; его изобрёл и использовал алгоритм машинного обучения»).

  1. Home

  2. News

This A.I. makes up gibberish words and definitions that sound astonishingly real

A sesquipedalian is a person who overuses uncommon words like lameen (a bishop’s letter expressing a fault or reprimand) or salvestate (to transport car seats to the dining room) just for the sake of it. The first of those italicized words is real. The second two aren’t. But they totally should be. They’re the invention of a new website called This Word Does Not Exist. Powered by machine learning, it conjures up entirely new words never before seen or used, and even generates a halfway convincing definition for them. It’s all kinds of brilliant.

“In February, I quit my job as an engineering director at Instagram after spending seven intense years building their ranking algorithms like non-chronological feed,” Thomas Dimson, creator of This Word Does Not Exist, told Digital Trends. “A friend and I were trying to brainstorm names for a company we could start together in the A.I. space. After [coming up with] some lame ones, I decided it was more appropriate to let A.I. name a company about A.I.”

Then, as Dimson tells it, a global pandemic happened, and he found himself at home with lots of time on his hands to play around with his name-making algorithm. “Eventually I stumbled upon the Mac dictionary as a potential training set and [started] generating arbitrary words instead of just company names,” he said.

If you’ve ever joked that someone who uses complex words in their daily lives must have swallowed a dictionary, that’s pretty much exactly what This Word Does Not Exist has done. The algorithm was trained from a dictionary file Dimson structured according to different parts of speech, definition, and example usage. The model refines OpenAI’s controversial GPT-2 text generator, the much-hyped algorithm once called too dangerous to release to the public. Dimson’s twist on it assigns probabilities to potential words based on which letters are likely to follow one another until the “word” looks like a reasonably convincing dictionary entry. As a final step, it checks that the generated word isn’t a real one by looking it up in the original training set.

This Word Does Not Exist is just the latest in a series of “[Insert object] Does Not Exist” creations. Others range from non-existent Airbnb listings to fake people to computer-generated memes which nonetheless capture the oddball humor of real ones.

“People have a nervous curiosity toward what makes us human,” Dimson said. “By looking at these machine-produced demos, we are better able to understand ourselves. I’m reminded of the fascination with Deep Blue beating Kasparov in 1996 or AlphaGo beating Lee Sedol in 2016.”

Editors’ Recommendations

  • The iRobot Genius 4.0 update makes Roombas even smarter

  • Adobe’s new Photoshop and Illustrator features make the iPad a real photo editor

  • Nvidia’s new voice A.I. sounds just like a real person

  • An Amazon A.I. scientist wants to transform downtown Jackson, Mississippi

  • Clever new A.I. system promises to train your dog while you’re away from home





  • Health & Fitness

This outrageous massage chair has A.I voice control and blackout-proof power

bodyfriend quantum massage chair bang and olufsen ces 2021

Self-driving cars and 100-inch TVs might capture the headlines, but any tried-and-true CES veteran can tell you that the highlight of every show is the insane massage chairs that show up every year.

The destressing devices are generally more tricked out than anything that ever appeared on Pimp My Ride. And this year, you’d be hard-pressed to find one more loaded than Bodyfriend’s Quantum.

Read more

  • News

New A.I. hearing aid learns your listening preferences and makes adjustments

Widex Moment hearing aids.

One of the picks for this year’s CES 2021 Innovation Awards is a smart hearing aid that uses artificial intelligence to improve the audio experience in a couple of crucial ways.

Among the improvements the Widex Moment makes to conventional hearing aids is reducing the standard sound delay experienced by wearers from 7 to 10 milliseconds seconds down to just 0.5 milliseconds. This results in a more natural sound experience for users, rather than the out-of-sync audio experience people have had to settle for up until now.

Read more

  • Wearables

This A.I.-powered collar translates your dog’s barks and body language

Petpuls A.I.-powered dog collar

Have you ever wondered what your pet is trying to tell you? This collar may hold the answer. It’s one of the more intriguing pet-specific gadgets at CES 2021. CES has always been packed with pet-products that make caring for your pet more convenient, but few have had the potential impact of Petpuls’ A.I.-powered smart collar.

This collar uses voice recognition technology to detect and track five different emotional states. It analyzes the tone and pitch of your dog’s bark to tell you whether your pup feels happy, anxious, angry, sad, or relaxed — it’s just missing «squirrel.» If you are getting Up vibes, you aren’t alone.

Read more

29.05.2020

Here’s something fun for your Friday.

I just found (via Reddit) a site where an AI invents words and their definitions every time you refresh the page. For example:

This is not exactly new – I follow someone on Twitter who does this all the time with machine learning, and I also follow another account the generates words and definitions, and tweets them.

One way this site differs from similar projects is that the words and definitions  come very close to sounding real – if you found one in a legitimate dictionary, you would not question it.

Enjoy!

This Word Does Not Exist

P.S. Find any particularly cromulent words?

Like this post? Please share to your friends:
  • This word describes fresh
  • This word comes from the ancient latin word
  • This word can refer to a student
  • This word can hurt you
  • This word can get you around