Классификация документов: гайд для обхода граблей

У всех на слуху библейское изречение « отделять зерна от плевел » и его грубый аналог « отделять мух от котлет ». В обычной жизни мы также сталкиваемся с необходимостью разделять схожие предметы. В машинном обучении задача разделить объекты по определенным классам, например, « зерна » и « плевелы », называется классификация . Классификация лежит в основе современных технологий искусственного интеллекта и играет ключевую роль в машинном обучении.

https://habr.com/ru/articles/923828/

#классификация_документов #openvino #spp #bag_of_words

Классификация документов: гайд для обхода граблей

Привет, Хабр. Меня зовут Степанян Альберт ( [email protected] ), и я  бегун по граблям  разработчик компании ООО «Биорг» отдела R&D. Зачем нужна классификация в машинном...

Хабр

Что такое векторизация текста в NLP и какая она бывает: One-hot encoding, Bag of words, TF-IDF, Word2Vec, BERT и другие

Привет, Хабр! Меня зовут Александр Троицкий, я автор канала AI для чайников , и в этой статье я расскажу про разные способы векторизации текстов. Всем привет! Вдохновившись прикольной и понятной статьей на английском языке, и не найдя сходу чего-то похожего в русскоязычном сегменте интернета, решил написать о том, как обрабатывается текст перед тем, как на нем начинают применять разные модели ИИ. Эту статью я напишу нетехническим языком, потому что сам не технарь и не математик. Надеюсь, что она поможет узнать о NLP тем, кто не сталкивается с AI в продуктах на ежедневной основе. О чем эта статья:

https://habr.com/ru/articles/820159/

#Onehot_encoding #Bag_of_words #TFIDF #Word2Vec #BERT #NLP #nlp_(natural_language_processing) #nlpмодели

Что такое векторизация текста в NLP и какая она бывает: One-hot encoding, Bag of words, TF-IDF, Word2Vec, BERT и другие

Привет, Хабр! Меня зовут Александр Троицкий, я автор канала  AI для чайников , и в этой статье я расскажу про разные способы векторизации текстов. Всем привет! Вдохновившись  прикольной и...

Хабр