Max Schwarzer (@max_a_schwarzer)

작성자가 OpenAI를 떠난다는 발표. 본인은 MillionInt와 함께 'reasoning paradigm'을 만드는 일에 기여했고, polynoamial과 테스트 시 연산 확장 작업, 동료들과 강화학습(RL) 알고리즘 개발, 그리고 o1-preview를 배포하는 등의 활동을 해왔다고 밝힘. 퇴사와 함께 그간 참여한 기술·제품 이력이 요약되어 있음.

https://x.com/max_a_schwarzer/status/2028939154944585989

#openai #o1preview #rl #reasoning

Max Schwarzer (@max_a_schwarzer) on X

I've decided to leave OpenAI. I'm incredibly proud of all the work I've been part of here, from helping create the reasoning paradigm with @MillionInt, scaling up test-time compute with @polynoamial, working on RL algorithms with my fellow strawberries, shipping o1-preview (which

X (formerly Twitter)
OpenAIs o1-preview hackt sich zum Schachsieg, statt den Regeln zu folgen

OpenAIs "Reasoning"-Modell o1-preview hat in einem Schachspiel gegen die Schachmaschine Stockfish außerhalb der Spielregeln agiert.

THE-DECODER.de

Будущее LLM: 7 прогнозов на 2025 год

Языковые модели, или LLM, продолжают впечатлять своим развитием. Технологии становятся умнее, их возможности шире, а применение в бизнесе и жизни — еще полезнее. В 2024 году LLM обрели зрение и память, получили доступ к актуальной информации и подтянули знания в кодинге. Чего ожидать от 2025 года? Собрал наиболее правдоподобные прогнозы и добавил свои. Спойлер: Джарвиса, который будет делать за нас всю работу, ждать не стоит.

https://habr.com/ru/articles/870002/

#искусственный_интеллект #llm #llmarena #finetuning #rag #agi #o1preview #openai #gpt

Будущее LLM: 7 прогнозов на 2025 год

Языковые модели, или LLM, продолжают впечатлять своим развитием. Технологии становятся умнее, их возможности шире, а применение в бизнесе и жизни — еще полезнее. В 2024 году LLM обрели зрение и...

Хабр
OpenAI just unleashed an alien of extraordinary ability https://www.understandingai.org/p/openai-just-unleashed-an-alien-of (very good explanation of how it works, what it can & can’t do) #AI #OpenAI #o1preview
OpenAI just unleashed an alien of extraordinary ability

It's not easy to stump OpenAI's new o1 models.

Understanding AI

Больше не нужны: ChatGPT заменяет программиста

Привет кодерки – шапки из фольги! Недавно OpenAI выложила маглам на растерзание новенькую модель o1-preview которая по их словам якобы "думает" перед ответом. Но заместо, как я ожидал, модели с непрерывным потоком токенов которые она может выплёвывать юзерам по желанию, мы получили модель лишь способную кукукать себе под рыло перед выдачей результата. Но этого уже хватает чтобы программисты стали не нужными. 🐷

https://habr.com/ru/articles/844462/

#chatgpt #o1preview

Больше не нужны: ChatGPT заменяет программиста

Привет кодерки – шапки из фольги! Недавно OpenAI выложила маглам на растерзание новенькую модель o1-preview которая по их словам якобы "думает" перед ответом. Но заместо, как я ожидал, модели с...

Хабр

Насколько нейросеть — хороший калькулятор?

Насколько опасно умножать числа с помощью ChatGPT и OpenAI o1-preview, насколько можно доверять вычисленным ей константам? Стоит ли тратить деньги на o1-preview, если есть mini (в контексте умножения чисел)? Мини-исследование под катом.

https://habr.com/ru/companies/bar/articles/844378/

#openai #chatgpt #gpt #o1 #o1preview #o1mini

Насколько нейросеть — хороший калькулятор?

Исследованием поделился Yuntian Deng в Твиттере. Он протестировал умножение чисел с разным количеством знаков, вплоть до 20. На примере сравнения o1, o1-mini и gpt-4o. Оказалось, что GPT4o еле вывозит...

Хабр

ЧГК-GPT, или насколько хорош новый ChatGpt o1-preview в спортивном «Что? Где? Когда?»

12 сентября 2024 года OpenAI представила новую модель OpenAI o1-preview - первую модель, которая по утверждению создателей умеет "рассуждать". Я решил посмотреть, насколько хорошо она умеет отвечать на вопросы из игры "Что? Где? Когда?"

https://habr.com/ru/articles/843278/

#o1preview #что_где_когда #chat_gpt #openai

ЧГК-GPT, или насколько хорош новый ChatGpt o1-preview в спортивном «Что? Где? Когда?»

12 сентября 2024 года OpenAI представила новую модель OpenAI o1-preview - первую модель, которая по утверждению создателей умеет "рассуждать". Я решил посмотреть, насколько хорошо она умеет отвечать...

Хабр

Das Modell hat meinen Code überarbeitet, genau erklärt, warum es nicht funktionierte. Ergebnis: Code viel aufgeräumter, Problem gelöst. Das ist wirklich der Hammer, zumindest für Leute wie mich, die nur selten entwickeln.

#o1preview #OpenAI #SwiftUI #iOS (2/2)

penAI ha presentado su última innovación: la serie de modelos o1, diseñados para abordar problemas complejos con una capacidad de razonamiento superior. El primer modelo de esta serie, o1-preview, ya está disponible en ChatGPT y la API de OpenAI, marcando un hito en el desarrollo de la inteligencia artificial.

Un Enfoque Revolucionario

A diferencia de modelos anteriores, o1-preview se toma su tiempo para analizar y comprender los problemas antes de ofrecer una solución. Esta capacidad de «reflexión» le permite abordar tareas complejas que requieren un razonamiento profundo, superando las limitaciones de modelos anteriores en áreas como la ciencia, la codificación y las matemáticas.

Resultados Sorprendentes

Las pruebas realizadas con o1-preview han arrojado resultados impresionantes. El modelo ha demostrado un rendimiento comparable al de estudiantes de doctorado en campos como la física, la química y la biología. Además, ha sobresalido en matemáticas, logrando un 83% de aciertos en un examen clasificatorio para la Olimpiada Internacional de Matemáticas, y en codificación, alcanzando el percentil 89 en competiciones de Codeforces.

Aplicaciones Potenciales

Las capacidades de razonamiento de o1-preview abren un abanico de posibilidades en diversos campos. Investigadores sanitarios podrían utilizarlo para analizar datos de secuenciación celular, físicos para generar fórmulas matemáticas complejas y desarrolladores para construir flujos de trabajo sofisticados.

Seguridad Reforzada

OpenAI ha implementado un nuevo enfoque de formación en seguridad que aprovecha las capacidades de razonamiento de o1-preview para garantizar su adhesión a las directrices de seguridad y alineación. El modelo es capaz de razonar sobre las normas de seguridad en contexto, aplicándolas de manera más efectiva.

Colaboración con Instituciones de Seguridad

OpenAI ha formalizado acuerdos con los Institutos de Seguridad de la IA de EE.UU. y el Reino Unido, brindándoles acceso anticipado a una versión de investigación de o1-preview. Esta colaboración busca establecer un proceso riguroso de investigación, evaluación y prueba de futuros modelos antes y después de su lanzamiento.

OpenAI o1-mini: Eficiencia y Rentabilidad

Junto con o1-preview, OpenAI ha lanzado o1-mini, un modelo de razonamiento más rápido y económico, especialmente eficaz en la codificación. o1-mini es un 80% más barato que o1-preview, lo que lo convierte en una opción atractiva para aplicaciones que requieren razonamiento pero no un amplio conocimiento del mundo.

Disponibilidad y Acceso

Los usuarios de ChatGPT Plus y Team ya pueden acceder a los modelos o1 en ChatGPT. Los usuarios de ChatGPT Enterprise y Edu tendrán acceso a partir de la próxima semana. Los desarrolladores que cumplan los requisitos pueden empezar a crear prototipos con ambos modelos en la API de OpenAI.

El Futuro del Razonamiento Artificial

o1-preview representa un avance significativo en el campo de la inteligencia artificial. Su capacidad de razonamiento profundo abre nuevas posibilidades para abordar problemas complejos y desarrollar soluciones innovadoras en diversos campos. A medida que OpenAI continúe mejorando y expandiendo la serie o1, podemos esperar un futuro en el que la IA desempeñe un papel aún más crucial en la resolución de los desafíos más apremiantes de la humanidad.

Compartir:

https://tecnologiageek.com/openai-o1-preview-la-nueva-era-del-razonamiento-artificial/13/

#ChatGPT #inteligenciaArtificial #o1Preview #OpenAI #razonamientoArtificial

Apple y OpenAI se asocian para llevar la IA generativa al software de Apple

Apple y OpenAI han firmado un acuerdo para integrar la tecnología de IA generativa de OpenAI en el software de Apple, según informa The Information. Este acue

Tecnología Geeks y gadgets, móviles, informática, electrónica
I did another #openai #o1preview experiment, asking it an ApostropheCMS development question I knew to be hard but not impossible. It started out well, then generated some absolute hallucinated AI bullshit garbage halfway through. I think we can safely assume #o1 is not a silver bullet for #AI overconfidence.