Спільне дослідження фахівців Microsoft, University of California в Irvine і Чеського Технічний Університет показало, що понад 70 відсотків коду на GitHub є копіями проектів, які часто не зазнали жодної обробки.

Спочатку метою восьми дослідників було визначення того, як сильно відрізняється раніше скопійований код при використанні в нових проектах. В ході роботи з’ясувалося, що величезна кількість проектів використовує «неймовірну кількість копій, зроблених на рівні файлів».

З 428 млн файлів, вивчених в ході дослідження, тільки 85 млн виявилися унікальними. А при проведенні проектного аналізу з’ясували, що від 9 до 31 відсотка проектів містять принаймні 80 відсотків файлів з інших проектів. Ця знахідка спонукала дослідників змістити акценти, що призвело до створення публічного індексу дублювання коду («індекс Дежавю»).

Унікальність коду

Унікальність коду

Відповідно до розрахунків, найменш унікальною мовою програмування назвали JavaScript. У всьому масиві коду лише 6 відсотків коду виявилися оригінальними. Дослідники віднесли до дублікатів 73 відсотки коду екосистеми C ++ і 71 відсоток Python-коду. Най індивідуальнішою мовою програмування назвали Java – але і в ній обсяг дубльованого коду досягає 40 відсотків.

Очевидно, на показники “Індексу Дежавю”  впливає характер мови. За допомогою опублікованого звіту автори сподіваються допомогти іншим дослідникам врахувати особливості повторюваності при вивченні тенденцій в розробці.

Якщо ви знайшли помилку, будь ласка, виділіть фрагмент тексту та натисніть Ctrl+Enter.




Схожі новини

2 хв
Новини ІТ

Microsoft може позбавитись серії Surface вже у 2019 році

Початок жовтня для Microsoft вийшов плідним – компанія представила одразу кілька своїх новинок. Це планшет Pro 6, ноутбук Laptop 2 та моноблок Studio 2. І хороші ж вийшли пристрої, тільки ціна зависока. Однак, фахівці продовжуть «шепотіти на вухо» Microsoft, що час фокусуватися на інших підрозділах, а серію Surface відкласти назавжди у найдальшу шухляду. Ще з минулого року, глава дослідницької компанії Canalys, Стів Бразіл, […]


2 хв
Новини ІТ

Чергове оновлення Windows спричинює «синій екран смерті»

Проблеми з жовтневим оновленням Windows 10 (версія 1809) не закінчуються. Чергове оновлення «десятки» викликає на деяких комп’ютерах так званий «синій екран смерті». Оновлення Windows 10 під назвою KB4464330 для версії 1809 і оновлення KB4462919 для квітневого апдейту (версія 1803) спричинює на комп’ютерах HP «синій екран смерті», який дуже важко виправити. Корпорація Microsoft вже визнала помилку […]


2 хв
Новини ІТ

Microsoft зробила важливий крок для підтримки Linux

Microsoft сьогодні заявила, що приєднується до Open Invention Network (OIN) – патентної групи з відкритим кодом, призначеної для захисту Linux від патентних судових позовів. Це робить бібліотеку компанії з більш ніж 60 000 патентами відкритою та доступною для членів OIN. OIN надає ліцензійну платформу Linux для 2400 компаній від невеликих розробників до корпорацій, таких як […]


Повідомити про помилку

Текст, який буде надіслано нашим редакторам: