677
难道是越来越流行音乐意义不大?
最近我一直在思考了很多关于如何事情发生了改变流行音乐。我特别想知道,如果它成为音乐在美国的意义不大(这是从老一代的批评的共同话题)受欢迎。为了证明或反驳这一说法,我有“不聪明”的定义是指没有在文字和各种词汇表达较少。
通过学习流行音乐,你可以学到很多东西,因为它影响了大量美国人的文化。如果说流行音乐是不敏感,因此质疑美国人口的智力水平。
搜索互联网上的信息,我发现了一篇文章 网站赫芬顿邮报,分析基本单词,在流行歌曲,写在不同的时间使用。我想从这篇文章的数据说话怎么卷了不同的方法在美国写作文一定时间。
我也想参加查明真相,有一个更一般的统计数据,这将是更侧重于文本的语义内容作为一个整体,而不是在歌曲中使用某些主题。我发现威廉·布里格斯(威廉·布里格斯),其中他认为音乐只是变得比以前更傻着 的文章。它分析的唯一字的数量的比率[在这种情况下,“唯一”的话有可能理解,出现在歌不超过一次的话 - 约。 Perevi]在流行的歌曲,以在它们的字的总数,并使用该研究的结果是有意义的文本的水平下降的证据。
想耽误工作,他diplomnomom,检查出的研究和布里格斯的结果,用Python语言编写一个程序,我决定开展一项类似的研究,使用的前40命中,每年自1950年以来的名单至今。布里格斯并没有说什么样的音乐,它是专门用于分析,不过,它表明,它的源材料是关于我的一样。
该网站 TOP40排行榜可以找到所有的40名单的最佳音乐命中,每年自1950年以来为,在简单的表格的形式发出。我可以很容易地使用每个项目列表中的一个简单的周期和项目美丽的汤。所以,我下载的艺术家和歌曲标题的名字在MongoDB中,使用PyMongo作为一名车手。
所以,在我的处置从所有列表中几乎所有的音乐命中顶部40,除了一些低质量的材料:在一些歌曲的名字找到了我,证明排版及其他错误。在那之后,我需要找到歌词。而这里开始的困难,我不cmog找到负担得起的和免费的API与歌词的工作,而不是想编写一个程序,skraper,将收集关于谷歌的搜索结果。原来,资源 lyrics.wikia.com 可以找到很多的歌词和页面结构,可以有效地找到所需的文件,以大量的组合物。
唯一的问题是,每首歌曲的地址是非常具体的,丝毫不准确导致了大音乐集团之间的50多岁的404错误已经非常流行自称为“如此这般的”,“某某等等与乐队“或”某某所以和他的乐队“等,并且这使得难以搜索文件。我加速了这一过程,通过使用歌曲和艺术家姓名不同的正则表达式,其中,例如,去除括号中的指定的名称或短语的名称。最后,它是寻找歌词的成功的决定性因素。我决定,这项研究的结果将是足够的分析。
在此之后,这是不难分析不同年份的歌曲的文本和他们互相比较。起初,我发现的唯一字的数量在每首歌曲,在每首乐曲的字的总数,并发现这两个指标之间的关系。我的研究的结果,证实了布里格斯描述:唯一字的数量,和总数随时间增加,而它们的关系的值变得更小。这可能意味着,在流行歌曲文本语义内容水平下降真的。
增加的文字语言的总数量,你也许可以解释过渡到其他流派:在爵士大乐队和歌曲的曲风迪斯科比表演说唱或岩石'N'滚音乐家的成分的话肯定更少的歌词。此外,往年大乐团爵士没有使用合唱团,这显著减少一首歌重复的单词数的支持。
有趣的是,字的总数和在歌曲唯一字的数量在2003年达到其最大值,其中可能成为在说唱和R&B的体裁大量的命中的原因,在这个时候出现。顶线在今年的40最伟大的命中,充满了歌曲50美分,阿姆,杰伊Z,和其他人的名单。随后的减少可能是由于电子音乐和舞曲的普及。
我想了解在这个主题稍微深一点,因此在分析的歌词词的平均长度。其每年价值是非常接近的四个字符。我还计算在不同长度的歌曲词的平均数目。同样地,所有的话四,五,六,七或八个字母的字的数量每年几乎保持不变。
因此,虽然唯一字,以今天的歌曲词的总数的比率可以是更小,然而,上了年纪的歌曲的歌词不一定在同一时间“更有意义”。鉴于上述情况,我们可以得出结论,这本身单词的长度几乎没有对他们的质量。
我以最终确保数据已收到由我十分正确的花费控制检查。我会感到羞耻,如果我的结论可以很容易地通过非标准文本有很多长期的或独特的单词几个例子驳斥。我考虑到这种可能性,通过计算的变异 的字长的系数和在每首歌曲唯一字的数量。一般的规则是:如果小于一变异系数,据信该数据是相当正确的。
你可以阅读更多关于这个因素在<一的意义href="http://math.stackexchange.com/questions/260617/how-to-determine-if-standard-deviation-is-high-low">посте StackExchange,其中载有关于该主题的其他有用的资源。结果发现,文本的内容在此期间保持稳定,因此,任何“反例”不能让不正确的结果。
流行歌曲装载语义的水平,更详细的分析将需要深入理解课文的内容,但高于一般信息表明,艺人随时间的文本已经变得不那么有创意。具体来说,文字变得更重复。以文字和独特的词在歌曲数量总体上升,你也许可以解释歌曲的喜欢说唱或独立摇滚风格更为强烈的口头内容,与爵士管弦乐队的音乐上世纪50年代或70年代的迪斯科相比较。
由于单词的平均长度已经没有多少时间的推移改变,我相信它不可能肯定地说,目前音乐已经成为“更傻”,布里格斯说。更准确,更客观的将是声明这首歌变得冗长,而且通常使用重复的副歌。
该实验的范围内生成的代码,完全贴在 Github上的。该数据库也是在公共领域(同上) - 如果你想知道获得歌曲的文本。
资料来源:<一href="http://geektimes.ru/company/audiomania/blog/252532/">geektimes.ru/company/audiomania/blog/252532/