Головна » Технології / Новини » Meta представила генератор тексту в зображення за допомогою штучного інтелекту

У метавсесвіті будуть правила, відмінні від всесвіту, в якому ми живемо. Практично будь-хто зможе створити все, що спадає на думку. У якомусь сенсі правила сильно відрізнятимуться. Але оскільки ми говоримо про новий світ, де компʼютери та люди житимуть і працюватимуть пліч-о-пліч, доцільно знати, як відбуватиметься ця співпраця. Однією з таких спільних робіт є генератор тексту в зображення. Зараз це дуже популярно. Наприклад, OpenAI пропонує свій Craiyon, а Google може похвалитися Imagen. І от компанія Meta, яка є одним з провідних гравців у цій галузі, анонсувала свій власно розроблений механізм генерування зображень за допомогою штучного інтелекту – Make-A-Scene. Як заявили в компанії, новий рушій допоможе людям створювати більш захопливе мистецтво в метавсесвіті.




В теорії, генератор тексту в зображення є простою річчю. Наприклад, коли ви вимовляєте ключове словосполучення «робот-монстр-ведмідь, що їде на поїзді», механізм спочатку пропускає його через трансформаторну модель, нейронну мережу, а потім «розуміє», що ви сказали, і розвиває контекстне розуміння їхнього звʼязку один з одним. Коли він виконає всі кроки, згадані вище, і зрозуміє, що ви мали на увазі, він створить зображення за допомогою штучного інтелекту, використовуючи набір генеративних змагальних мереж.

Meta Make-A-Scene (робот-монстр-ведмідь, що їде на поїзді - a monster robot bear riding a train)

Завдяки розвитку машинного навчання та його здатності до самонавчання, механізми генератора тексту в зображення здатні створювати будь-яку нісенітницю. Можна сказати, що всі рушії працюють за однаковим принципом. Однак, вони відрізняються з огляду обробки штучного інтелекту. Наприклад, Imagen від Google віддає перевагу моделі дифузії, яка вчиться перетворювати шаблон випадкових точок на зображення. Ці зображення спочатку мають низьку роздільну здатність, а потім поступово збільшуються. З іншого боку, Parti від Google спочатку перетворює колекцію зображень на послідовність записів коду, схожу на частини головоломки. Даний текстовий запит потім перекладається на ці записи коду, і створюється нове зображення. Однак, ви повинні знати, що як користувач ви не можете контролювати конкретні аспекти вихідного зображення.

«Щоб реалізувати потенціал штучного інтелекту для просування творчого самовираження люди повинні мати можливість формувати та контролювати контент, який створює система».

Марк Цукерберг, генеральний директор Meta

Якщо Ви знайшли помилку, будь ласка, виділіть фрагмент тексту та натисніть Ctrl+Enter.
Поділитися:
Правила коментування

Вітаємо Вас на сайті Pingvin Pro. Ми докладаємо всіх зусиль, аби переконатися, що коментарі наших статей вільні від тролінгу, спаму та образ. Саме тому, на нашому сайті включена премодерація коментарів. Будь ласка, ознайомтеся з кількома правилами коментування.

  1. Перш за все, коментування відбувається через сторонній сервіс Disqus. Модератори сайту не несуть відповідальність за дії сервісу.
  2. На сайті ввімкнена премодерація. Тому ваш коментар може з’явитися не одразу. Нам теж інколи треба спати.
  3. Будьте ввічливими – ми не заохочуємо на сайті грубість та образи. Пам’ятайте, що слова мають вплив на людей! Саме тому, модератори сайту залишають за собою право не публікувати той чи інший коментар.
  4. Будь-які образи, відкриті чи завуальовані, у бік команди сайту, конкретного автора чи інших коментаторів, одразу видаляються. Агресивний коментатор може бути забанений без попереджень і пояснень з боку адміністрації сайту.
  5. Якщо вас забанили – на це були причини. Ми не пояснюємо причин ані тут, ані через інші канали зв’язку з редакторами сайту.
  6. Коментарі, які містять посилання на сторонні сайти чи ресурси можуть бути видалені без попереджень. Ми не рекламний майданчик для інших ресурсів.
  7. Якщо Ви виявили коментар, який порушує правила нашого сайту, обов’язково позначте його як спам – модератори цінують Вашу підтримку.

Підтримати сайт

Buy Me a Coffee

Схожі новини

Новини

ASUS представила MGX-сервери для центрів обробки даних

Компанія ASUS представила власні серверні рішення на міжнародній конференції NVIDIA GTC, присвяченій технологіям штучного інтелекту. На GTC 2024 представлено новітні GPU-сервери ASUS ESC NM1-E1 і ESC NM2-E1 на основі еталонної модульної архітектури NVIDIA MGX. Вони пришвидшують суперкомпʼютерні обчислення завдань штучного інтелекту. Підписуйтесь на наш Telegram-канал Щоб задовольнити попит, що зростає, на рішення для генеративного ШІ, […]


Пристрої

3 смартфони з високою обчислювальною потужністю: які моделі обирають українці

Гаджети з продуктивними процесорами забезпечують швидкодію у роботі в режимі багатозадачності, здатні витримувати великі навантаження під час ігрових сесій або в процесі оброблення контенту. Якщо ви плануєте придбати дійсно потужний смартфон, ознайомтеся з моделями, що мають попит в Україні. Підписуйтесь на наш Telegram-канал Apple iPhone 15 Pro Max 256GB 15 покоління смартфонів флагманської лінійки Pro […]


Повідомити про помилку

Текст, який буде надіслано нашим редакторам: