Головна » Технології / Новини » 70% коду на GitHub – копії інших проектів

Спільне дослідження фахівців Microsoft, University of California в Irvine і Чеського Технічний Університет показало, що понад 70 відсотків коду на GitHub є копіями проектів, які часто не зазнали жодної обробки.




Спочатку метою восьми дослідників було визначення того, як сильно відрізняється раніше скопійований код при використанні в нових проектах. В ході роботи з’ясувалося, що величезна кількість проектів використовує «неймовірну кількість копій, зроблених на рівні файлів».

З 428 млн файлів, вивчених в ході дослідження, тільки 85 млн виявилися унікальними. А при проведенні проектного аналізу з’ясували, що від 9 до 31 відсотка проектів містять принаймні 80 відсотків файлів з інших проектів. Ця знахідка спонукала дослідників змістити акценти, що призвело до створення публічного індексу дублювання коду («індекс Дежавю»).

Унікальність коду

Унікальність коду

Відповідно до розрахунків, найменш унікальною мовою програмування назвали JavaScript. У всьому масиві коду лише 6 відсотків коду виявилися оригінальними. Дослідники віднесли до дублікатів 73 відсотки коду екосистеми C ++ і 71 відсоток Python-коду. Най індивідуальнішою мовою програмування назвали Java – але і в ній обсяг дубльованого коду досягає 40 відсотків.

Очевидно, на показники “Індексу Дежавю”  впливає характер мови. За допомогою опублікованого звіту автори сподіваються допомогти іншим дослідникам врахувати особливості повторюваності при вивченні тенденцій в розробці.

Якщо Ви знайшли помилку, будь ласка, виділіть фрагмент тексту та натисніть Ctrl+Enter.
Поділитися:
Правила коментування

Вітаємо Вас на сайті Pingvin Pro. Ми докладаємо всіх зусиль, аби переконатися, що коментарі наших статей вільні від тролінгу, спаму та образ. Саме тому, на нашому сайті включена премодерація коментарів. Будь ласка, ознайомтеся з кількома правилами коментування.

  1. Перш за все, коментування відбувається через сторонній сервіс Disqus. Модератори сайту не несуть відповідальність за дії сервісу.
  2. На сайті ввімкнена премодерація. Тому ваш коментар може з’явитися не одразу. Нам теж інколи треба спати.
  3. Будьте ввічливими – ми не заохочуємо на сайті грубість та образи. Пам’ятайте, що слова мають вплив на людей! Саме тому, модератори сайту залишають за собою право не публікувати той чи інший коментар.
  4. Будь-які образи, відкриті чи завуальовані, у бік команди сайту, конкретного автора чи інших коментаторів, одразу видаляються. Агресивний коментатор може бути забанений без попереджень і пояснень з боку адміністрації сайту.
  5. Якщо вас забанили – на це були причини. Ми не пояснюємо причин ані тут, ані через інші канали зв’язку з редакторами сайту.
  6. Коментарі, які містять посилання на сторонні сайти чи ресурси можуть бути видалені без попереджень. Ми не рекламний майданчик для інших ресурсів.
  7. Якщо Ви виявили коментар, який порушує правила нашого сайту, обов’язково позначте його як спам – модератори цінують Вашу підтримку.

Підтримати сайт

Buy Me a Coffee

Схожі новини

Новини

Copilot для Microsoft 365 тепер говорить українською

Microsoft оголосила підтримку нових мов у Copilot для Microsoft 365. Українська мова входить до числа 16 мов, які додано до сервісу. Microsoft Copilot — це «персональний помічник на основі ШІ». Це надпотужний інструмент на основі штучного інтелекту, призначений для допомоги у виконанні завдань, пошуку інформації, генерації креативних текстових форматів і коду. Copilot для Microsoft 365 […]


Пристрої

Жодних компромісів: огляд популярних моделей ноутбуків-планшетів

Якщо ви шукаєте функціональний та мобільний девайс з функціями графічного планшета і ноутбука, зверніть увагу на гібридні варіанти зі знімною клавіатурою та сенсорним екраном. Основні переваги пристроїв – потужність, функціональність, чутливий стилус, підтримка повноцінних операційних систем тощо. Ми склали рейтинг цікавих моделей, що задовольнять потреби найвибагливішого користувача. Підписуйтесь на наш Telegram-канал Asus ROG Flow Z13 […]


Повідомити про помилку

Текст, який буде надіслано нашим редакторам: