698
Як поп-музика стає менш значущою?

Про те, як змінюється поп-музика. Зокрема, я хотів би бачити, якщо поп-музика в США стала менш значущою (звичайна тема критики від старших поколінь). Для того, щоб довести або розпроваджувати цю претензію, я прийняв визначення «необгрунтних», що означає менш виразних і різнопланових слів.
Ви можете дізнатися багато про поп-музику, оскільки вона вплинула на культуру багатьох американців. Заперечатися, що поп-музика безглузда - це питання інтелектуального рівня американського населення.
Пошук інтернету я знайшов статтю на сайті Huffington Post, що аналізує основні слова, які використовуються в поп-піснях, написаних в різні часи. Я думаю, що дані з цієї статті говорить багато про те, як ми пишемо в Америці.
Я хотів би брати участь у роз’ясненні правди, маючи більш загальну статистику, яка буде зосереджена більше на смисловому змісті слова загалом, ніж на використанні певних тем в піснях. Я знайшов статтю Вільяма Брігса, в якій він стверджує, що музика стала набагато темним, ніж раніше. Проаналізовано співвідношення кількості унікальних слів у популярних піснях до загальної кількості слів в них, а також використовує результати дослідження як докази рівня декларування значущості слова.
Бажаю затримувати мій випуск, перевірити дослідження Briggs, і писати програму Python, я вирішив зробити аналогічне дослідження за допомогою списків топ 40 хітів на рік з 1950 по теперішній час. Брагс не сказав, що музика, яку він використовується для аналізу, але виявилося, що його вихідний матеріал був про те, що і шахта.
На сайті Top40 Charts ви можете знайти всі списки 40 кращих музичних хітів за рік з 1950 року, розташованих в простих таблицях. Я можу легко використовувати будь-який елемент списку з простим циклом і красивим супним проектом. Так я завантажив імена артистів і назв пісень до МонгоДБ за допомогою PyMongo як драйвера.
Так я мав майже всі топ 40 хітів у моєму розпорядженні, крім того, якийсь неякісний матеріал: деякі назви пісень я знайшов мав друкарські та інші помилки. Після цього я мав знайти слова. І ось де почалися труднощі: Я не можу знайти доступний і безкоштовний API для роботи з текстами, і я не хочу писати програму брухту, яка буде збирати результати пошуку в Google. Виявилося, що на ресурсних словах. wikia.com ви можете знайти безліч текстів і структури сторінок дозволяє ефективно шукати необхідні файли серед великої кількості пісень.
Єдиною проблемою було те, що адреса кожної пісні була дуже специфічною і найменшою неточністю призвела до 404 помилки. У «50-х роках було дуже популярним серед великих музичних колективів, щоб назвати себе «Со-і-со», «Со-і-со і оркестр» або «Со-і-со і його оркестр», і т.д., що ускладнює пошук файлів. Виконав цей процес, використовуючи різні формальні вирази у своїй роботі з іменами пісень та іменами художника, які, наприклад, знімали титули або фрази у дужках. В кінці цього доведено вирішальний фактор успішного пошуку слів. Я вирішив, що результати такого пошуку були достатніми для аналізу.

Після цього було легко аналізувати пісні з різних років і порівняти їх один з одним. Я перший погляд на кількість унікальних слів в кожній пісні, загальна кількість слів в кожній пісні, і знайшов зв'язок між двома. Результати моїх досліджень підтвердили, що описано Briggs: кількість унікальних слів і їх загальна кількість збільшилася з часом, а значення їх відносин стала значно меншою. Це може означати, що рівень семантичного змісту текстів у популярних піснях дійсно знижується.

Збільшення загальної кількості слів в словах, ймовірно, пояснюється переходом в інші жанри: в словах пісень великих джазових оркестрів і пісень в жанрі дискотека, ймовірно, менше слів, ніж в композиціях музикантів, які рапсу або виконують рок і рол. Крім того, основні джазові оркестри раніше років не використовували підтримку хору, що істотно скорочувало кількість повторних слів в пісні.
Цікаво, що загальна кількість слів і кількість унікальних слів в піснях, які пікували в 2003 році, можливо, завдяки великій кількості хітів в жанрі рапсу і R&B, які з'явилися в цей час. Кращі лінії в списку 40 кращих хітів цього року сповнені пісень 50 Cent, Eminem, Джей Z та інші. Наступне зниження може бути результатом популярності електронної музики та танцювальних хітів.
Я хотів би отримати трохи більш глибоким в темі, тому я подивився на середню довжину слова. Його значення в кожному році було дуже близько до чотирьох символів. Я також розрахував середню кількість слів різної довжини в піснях. Аналогічно, частка чотири-, п'ять-, шість-, сім-, і восьмих слів серед всіх слів щороку залишається практично незмінною.
Так, хоча співвідношення унікальних слів до загальної кількості слів в піснях сьогодні може бути меншим, слова старших пісень не обов'язково більш значущими. Зважаючи на це, ми можемо зробити висновок, що довжина слів окремо говорить про їх якість.
612780
Я провів перевірку, щоб переконатися, що дані, які я отримав достатню кількість. Я хотів би, якщо мої висновки можуть бути легко відхилені декількома прикладами нестандартних текстів з багатьма довгими або унікальними словами. Розглянуто цю можливість шляхом обчислення коефіцієнта варіації для довжини слів і кількості унікальних слів в кожній пісні. Загальна правило полягає в тому, що якщо коефіцієнт варіації менше одного, дані вважається правильним.
Детальніше про значення цього співвідношення можна дізнатися в пост StackExchange, який містить інші корисні джерела на тему. Виявилося, що зміст текстів залишається досить стабільним протягом цього періоду, тому будь-які «знижки» не змогли зробити результати дослідження некоректним.

Більш детальний аналіз рівня семантичного навантаження популярних пісень буде вимагати глибоке розуміння змісту текстів, але вищезазначена інформація говорить про те, що слова поп-артистів стають менш креативними протягом часу. У текстах обов’язково було повторне звернення. Загальна кількість слів і унікальних слів в піснях, ймовірно, пояснюється більш інтенсивним вербальним змістом пісень у жанрах, таких як рапс або інді-рок, у порівнянні з музикою великих джазових оркестрів 50-х або дискотека 70-х.
З середньої довжини слова не змінилося багато часу, я не можу сказати, що поточна музика стала «більше ступеню», як каже Briggs. Більш правильним і більш об'єктивним буде заява, що пісні стають більш дієслово, і вони часто використовують повтори в хорусі.
Код, створений в цьому експерименті, все завантажується в Github. База даних також доступна безкоштовно (ibid.) у разі, якщо ви зацікавлені у доступі текстів.
Джерело: geektimes.ru/company/audiomania/blog/252532/
У США не видали візи на більш ніж два тижні через комп'ютер
Роботи стають доступнішими, більше робочих місць зникають