📰 Новини
Google представила Gemini 3.5 Live Translate
DeepMind представила Gemini 3.5 Live Translate — новітню аудіомодель, що забезпечує майже миттєвий голосовий переклад у понад 70 мовах. Ця розробка знаменує собою важливий крок у розвитку технологій для легкого спілкування без мовних барʼєрів.
Gemini 3.5 Live Translate: швидкий голосовий переклад
Модель автоматично розпізнає понад 70 мов, генеруючи плавне та природне перекладене мовлення. Вона зберігає інтонацію, темп та висоту голосу мовців, що робить спілкування більш автентичним. На відміну від систем покрокового перекладу, які чекають завершення фрази, 3.5 Live Translate генерує переклад безперервно. Модель забезпечує неперервне аудіо без незручних пауз, відстаючи від мовця лише на кілька секунд. Йдеться про значний стрибок від початкових експериментів Google з перекладу, які трансформували мільярди слів щомісяця. Цією розробкою DeepMind продовжує розвивати свої передові ШІ-моделі.
Доступність Gemini 3.5 Live Translate
Запуск Gemini 3.5 Live Translate розпочався у кількох продуктах Google. Для розробників нова модель доступна в публічній попередній версії через API Gemini Live та Google AI Studio. Корпоративні клієнти отримають приватну попередню версію цього місяця у Google Meet. Для широкої аудиторії модель зʼявиться у застосунку Google Перекладач на Android та iOS. Ця гнучкість дозволяє інтегрувати технологію в різноманітні платформи та сценарії використання.
Інтеграція та нові можливості
Голосовий переклад обробляє мовлення під час його потокової передачі, що забезпечує безшовне зʼєднання між мовами. Модель працює з багатомовними вхідними даними, не вимагаючи ручного налаштування параметрів. Її стійкість до шуму гарантує ефективну роботу застосунків навіть у галасливих середовищах. Можливості моделі можна використовувати для живого перекладу під час багатомовних дзвінків, зустрічей, уроків та трансляцій. Платформи для розробників, як-от Agora, Fishjam, LiveKit та Pipecat, вже дозволяють розробникам створювати програми для голосового перекладу за допомогою API Gemini Live. Партнери, зокрема Grab, тестують модель для спілкування між водіями та пасажирами. Ця співпраця покращить понад 10 мільйонів голосових дзвінків на місяць.
Покращення в Google Meet та Перекладачі
Найближчим часом переклад мовлення у Google Meet почне використовувати Gemini 3.5 Live Translate. Це значно покращить досвід користувачів, розширивши підтримку до понад 70 мов, замість попередніх пʼяти. Також стане доступним спілкування у понад 2000 мовних комбінаціях, тоді як раніше переклад був лише з/на англійську. Інтерфейс отримає оновлення для миттєвого доступу до голосового перекладу. Розгортання моделі у Google Перекладачі на Android та iOS також передбачає новий «режим прослуховування», що дозволяє чути переклади без навушників, просто піднісши телефон до вуха. Увесь аудіоконтент, згенерований моделлю, має невідчутний водяний знак SynthID, який допомагає запобігти дезінформації. Завдяки цій моделі Google робить значний крок до світу, де мовні барʼєри стають менш помітними.
Правила коментування
Вітаємо Вас на сайті Pingvin Pro. Ми докладаємо всіх зусиль, аби переконатися, що коментарі наших статей вільні від тролінгу, спаму та образ. Саме тому, на нашому сайті включена премодерація коментарів. Будь ласка, ознайомтеся з кількома правилами коментування.
- Перш за все, коментування відбувається через сторонній сервіс Disqus. Модератори сайту не несуть відповідальність за дії сервісу.
- На сайті ввімкнена премодерація. Тому ваш коментар може з’явитися не одразу. Нам теж інколи треба спати.
- Будьте ввічливими – ми не заохочуємо на сайті грубість та образи. Пам’ятайте, що слова мають вплив на людей! Саме тому, модератори сайту залишають за собою право не публікувати той чи інший коментар.
- Будь-які образи, відкриті чи завуальовані, у бік команди сайту, конкретного автора чи інших коментаторів, одразу видаляються. Агресивний коментатор може бути забанений без попереджень і пояснень з боку адміністрації сайту.
- Якщо вас забанили – на це були причини. Ми не пояснюємо причин ані тут, ані через інші канали зв’язку з редакторами сайту.
- Коментарі, які містять посилання на сторонні сайти чи ресурси можуть бути видалені без попереджень. Ми не рекламний майданчик для інших ресурсів.
- Якщо Ви виявили коментар, який порушує правила нашого сайту, обов’язково позначте його як спам – модератори цінують Вашу підтримку.
Схожі новини
AUR виявив понад 400 шкідливих пакетів
Arch User Repository (AUR) є одним з ключових переваг операційної системи Arch Linux, надаючи користувачам неперевершений доступ до величезної кількості програмного забезпечення. Проте, нещодавно стало відомо, що в AUR виявили понад 400 шкідливих пакетів, що ставить під сумнів безпеку системи.
WhatsApp посилює протидію шпигунському ПЗ NSO
Провідний месенджер WhatsApp продовжує свою рішучу боротьбу проти фірми NSO Group, яка спеціалізується на шпигунському програмному забезпеченні. WhatsApp знову звернулася до суду, вимагаючи притягнути NSO Group до відповідальності за ігнорування судових заборон.