@writingslowly

This, i find particularly fascinating!
As one who is beginning a journey into the #AI #backend #ml_backend

(It's funny how you learn things about yourself as the years progress. I guess I've always been a backend developer type having zero instructor-led edu in CompSci, sans BASIC in the 80's)

But this @writingslowly makes me wonder whether it's valid that I'd consider this analogous to the way (i believe) AI processes some things. prior to it perhaps at least, in building a dataset?

@techcrunch
@cipharo
@chatgpt #MongoDB #dataset #bigdata #DeepLearning

[Перевод] Разметка данных в Label Studio при помощи GPT-4: интеграция ML Backend

Введение Получение качественных данных — краеугольный камень любого проекта машинного обучения. Этот процесс, в котором традиционно доминирует трудозатратная разметка данных, часто может превращаться в длительную и дорогостоящую задачу. Но что, если мы сможем воспользоваться прогрессом в развитии больших языковых моделей (LLM) для перехода от разметки данных к проверке разметки? На сцене появляется GPT-4. Эта система (разработанная на основе GPT-4), имеющая более ста миллионов пользователей — одна из самых популярных языковых моделей. В предыдущей статье мы показали, как можно ускорить процесс разметки предварительным аннотированием данных при помощи GPT-4. Эта методика позволяет нам загружать готовый к проверке предварительно размеченный датасет, а не выполнять монотонный процесс, начиная с нуля. В этой статье мы продолжим развивать эту тему, оказав, как можно объединить GPT-4 с бэкендом машинного обучения (ML Backend) Label Studio. При помощи Label Studio ML Backend можно размечать данные непосредственно в Label Studio, что позволяет нам совершить переход от трудозатратной задачи разметки данных к гораздо более эффективному процессу проверки и совершенствования предварительных меток, что существенно ускоряет работу.

https://habr.com/ru/articles/772974/

#машинное_обучение #GPT4 #Label_Studio #ML_Backend #разметка_данных #датасет #dataset

Разметка данных в Label Studio при помощи GPT-4: интеграция ML Backend

Введение Получение качественных данных — краеугольный камень любого проекта машинного обучения. Этот процесс, в котором традиционно доминирует трудозатратная разметка данных, часто может превращаться...

Хабр