Головна » Технології / Новини ІТ » 70% коду на GitHub – копії інших проектів

Спільне дослідження фахівців Microsoft, University of California в Irvine і Чеського Технічний Університет показало, що понад 70 відсотків коду на GitHub є копіями проектів, які часто не зазнали жодної обробки.




Спочатку метою восьми дослідників було визначення того, як сильно відрізняється раніше скопійований код при використанні в нових проектах. В ході роботи з’ясувалося, що величезна кількість проектів використовує «неймовірну кількість копій, зроблених на рівні файлів».

З 428 млн файлів, вивчених в ході дослідження, тільки 85 млн виявилися унікальними. А при проведенні проектного аналізу з’ясували, що від 9 до 31 відсотка проектів містять принаймні 80 відсотків файлів з інших проектів. Ця знахідка спонукала дослідників змістити акценти, що призвело до створення публічного індексу дублювання коду («індекс Дежавю»).

Унікальність коду

Унікальність коду

Відповідно до розрахунків, найменш унікальною мовою програмування назвали JavaScript. У всьому масиві коду лише 6 відсотків коду виявилися оригінальними. Дослідники віднесли до дублікатів 73 відсотки коду екосистеми C ++ і 71 відсоток Python-коду. Най індивідуальнішою мовою програмування назвали Java – але і в ній обсяг дубльованого коду досягає 40 відсотків.

Очевидно, на показники “Індексу Дежавю”  впливає характер мови. За допомогою опублікованого звіту автори сподіваються допомогти іншим дослідникам врахувати особливості повторюваності при вивченні тенденцій в розробці.

Якщо Ви знайшли помилку, будь ласка, виділіть фрагмент тексту та натисніть Ctrl+Enter.
Поділитися:

Новини партнерів

Правила коментування

Вітаємо Вас на сайті Pingvin Pro. Ми докладаємо всіх зусиль, аби переконатися, що коментарі наших статей вільні від тролінгу, спаму та образ. Саме тому, на нашому сайті включена премодерація коментарів. Будь ласка, ознайомтеся з кількома правилами коментування.

  1. Перш за все, коментування відбувається через сторонній сервіс Disqus. Модератори сайту не несуть відповідальність за дії сервісу.
  2. На сайті ввімкнена премодерація. Тому ваш коментар може з’явитися не одразу. Нам теж інколи треба спати.
  3. Будьте ввічливими – ми не заохочуємо на сайті грубість та образи. Пам’ятайте, що слова мають вплив на людей! Саме тому, модератори сайту залишають за собою право не публікувати той чи інший коментар.
  4. Будь-які образи, відкриті чи завуальовані, у бік команди сайту, конкретного автора чи інших коментаторів, одразу видаляються. Агресивний коментатор може бути забанений без попереджень і пояснень з боку адміністрації сайту.
  5. Якщо вас забанили – на це були причини. Ми не пояснюємо причин ані тут, ані через інші канали зв’язку з редакторами сайту.
  6. Коментарі, які містять посилання на сторонні сайти чи ресурси можуть бути видалені без попереджень. Ми не рекламний майданчик для інших ресурсів.
  7. Якщо Ви виявили коментар, який порушує правила нашого сайту, обов’язково позначте його як спам – модератори цінують Вашу підтримку.

Схожі новини

Новини ІТ

Microsoft випустила оновлення для Windows 7, Windows 8.1 та Windows Server

Компанія Microsoft випустила оновлення для версій операційних систем. Зокрема для Windows 7, Windows 8.1, Windows Server 2008 R2 та Windows Server 2012 R2. Між іншим, нещодавно стало відомо, чому Microsoft вимкнула звук під час запуску Windows. А ще – програма «Настройки» у Windows 11 зазнає змін у дизайні. Підписуйтесь на наш Telegram-канал KB5003671 Це оновлення стосується […]


Новини ІТ

Програма «Настройки» у Windows 11 зазнає змін у дизайні

Минуло майже дев’ять років відтоді як Microsoft вперше представила сучасний інтерфейс параметрів в операційній системі Windows 8. Навіть після випуску Windows 10, в ОС досі немає єдиного інтерфейсу для параметрів. Тобто, операційна система має сучасну програму «Настройки» (поняття не маю чому й досі така назва) та класичну «Панель керування». Компанія пояснює це тим, що програма […]


Новини партнерів

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: