layout | published |
---|---|
default |
false |
- אמזון השיקה סדרת מודלים חדשה בשם NOVA המיועדת לעיבוד טקסט, תמונות, ווידאו.
- OpenAI שחררה למנויים את SORA, מודל ליצירת וידאו, יחד עם O1 בגרסה מלאה ואת O1 Pro למנויים מתקדמים. בנוסף, החברה השיקה מצב וידאו חי עבור GPT4o.
- גוגל הציגה את המודל הניסיוני Gemini-Exp-1206, אשר זכה במקום הראשון בזירת הצ'אטבוטים.
- גוגל השיקה את Gemini 2.0 Flash בגרסת בטא. המודל מוביל במדדים ומציג ביצועים טובים יותר מהגרסה הקודמת Gemini Pro 1.5. כמו כן, גוגל השיקה מצב דיבור ווידאו חי והכריזה על יכולת יצירת תמונה מובנית בתוך המודל.
- גוגל חשפה מודל חשיבה בשם Gemini-2.0-Flash-Thinking, המבוסס על Gemini 2.0 Flash, שדורג במקום השני בזירת הצ'אטבוטים.
- גוגל השיקה את Veo 2, מודל ליצירת וידאו בגרסת בטא, המסוגל להפיק סרטוני 4K באורך של עד שתי דקות. המודל זכה לציון גבוה יותר מ-SORA בהערכה אנושית. בנוסף, גוגל עדכנה את Imagen 3 עם איכות תמונה וריאליזם משופרים.
- xAI שילבה את Aurora, מודל חדש ליצירת תמונות באיכות גבוהה וריאליסטית.
- מיקרוסופט פתחה לקוד פתוח את המודל Phi4 בגודל 14B, המציג ביצועים מרשימים ביחס לגודלו.
- Meta שחררה את Llama 3.3 70B, מודל המציע יכולות קרובות ל-Llama 3.1 405B.
- גוגל השיקה מודל מולטי-מודאלי בקוד פתוח בשם PaliGemma 2, המשלב דגמים מסדרת Gemma הקיימת.
- Pika Labs השיקה את 2.0, גרסה חדשה למחולל הווידאו מבוסס AI שלה.
- Meta הציגה את Apollo, מודל ליצירת וידאו, הזמין בשלושה גדלים שונים.
- Deepseek פתחה לקוד פתוח את Deepseek V3, מודל בגודל 671B פרמטרים, המציג ביצועים משופרים לעומת מודלי SOTA בקוד סגור.
- עליבאבא חשפה את QVQ-72B-Preview, מודל חשיבה מתקדם לניתוח תמונות, עם יכולות SOTA.
- OpenAI הכריזה על O3, מודל AI חדש שמשיג ביצועים פורצי דרך, כולל 87.5% במדד ARC-AGI, ציון 25.2% ב-Frontier Math Benchmark (לעומת פחות מ-2% בעבר), ו-87.7% בשאלות מדעיות ברמת דוקטורט. גרסה חסכונית בשם O3 Mini צפויה לצאת בינואר 2025, עם ביצועים דומים ל-O1, במהירות ובחיסכון משופרים.
- מודל יצירת הווידאו Kling 1.6 שוחרר, ומציג שיפורים משמעותיים בביצועיו.
- Amazon introduced a new series of models called NOVA, designed for text, image, and video processing.
- OpenAI released SORA, a video generation model, along with the full version of O1 and O1 Pro for advanced subscribers. Additionally, the company launched a live video mode for GPT4o.
- Google unveiled the experimental model Gemini-Exp-1206, which ranked first in the chatbot leaderboard.
- Google launched Gemini 2.0 Flash in beta. This model leads benchmarks and outperforms the previous version, Gemini Pro 1.5. Additionally, Google introduced live speech and video mode and announced built-in image generation capabilities within the model.
- Google revealed Gemini-2.0-Flash-Thinking, a thinking model based on Gemini 2.0 Flash, which secured second place in the chatbot leaderboard.
- Google introduced Veo 2, a beta version video generation model capable of producing 4K videos up to two minutes long. The model outperformed SORA in human evaluations. Additionally, Google updated Imagen 3, offering enhanced image quality and realism.
- xAI integrated Aurora, a new model for generating high-quality and realistic images.
- Microsoft open-sourced the Phi4 model, sized at 14B, showcasing impressive capabilities for its size.
- Meta released Llama 3.3 70B, a model offering performance comparable to Llama 3.1 405B.
- Google launched a multi-modal open-source model called PaliGemma 2, integrated with existing Gemma models.
- Pika Labs released 2.0, the latest version of its AI-powered video generator.
- Meta introduced Apollo, a video generation model available in three different sizes.
- Deepseek open-sourced Deepseek V3, a model with 671B parameters that surpasses closed-source SOTA models across several benchmarks.
- Alibaba unveiled QVQ-72B-Preview, a cutting-edge thinking model capable of analyzing images, featuring SOTA-level performance.
- OpenAI announced O3, a groundbreaking AI model achieving 87.5% in the ARC-AGI benchmark, 25.2% in the Frontier Math Benchmark (compared to under 2% in previous models), and 87.7% in Ph.D.-level science questions. A cost-effective version, O3 Mini, is expected in January 2025, with performance similar to O1, alongside improved speed and efficiency.
- The video generation model Kling 1.6 was released, offering significant performance enhancements.