Analisando os melhores álbuns brasileiros dos últimos anos a partir de dados do Spotify – Parte 1

2019 vai se aproximando do fim e logo vamos começar a esbarrar naquelas celebradas listas dos melhores álbuns brasileiros do ano. Em 2013 esse tipo de publicação virou objeto de estudo de Pena Schmidt, renomado produtor, consultor e pesquisador musical. Reunindo colaboradores como Elson Barbosa, do selo Sinewave?, Rafael Chioccarello, do site Hits Perdidos, e os sócios Juliano Polimeno e Daniel Cukier, da plataforma de análise de dados musicais Playax, Pena passou a consolidar essas listas, ano a ano, num projeto denominado #listadaslistas, que evidencia os trabalhos com maior número de aparições nas seleções de sites e blogs. Com edições de 2013 a 2018, a #listadaslistas passou a oferecer aos profissionais do mercado musical e ao público uma perspectiva nova sobre como jornalistas e críticos têm avaliado a produção musical nacional nos últimos anos (mais sobre o projeto aqui).

Refletindo sobre que tipo de valor um projeto desses pode gerar, especialmente para quem participa e/ou se interessa pela indústria musical, e buscando um objeto de estudo que unisse duas paixões minhas – música e ciência de dados – decidi dedicar uma parte do meu tempo livre para explorar mais a fundo quais informações e interpretações seria possível extrair da #listadaslistas, a partir da junção com outras fontes de dados.

E que tipo de dados estamos falando aqui? Bom, para essa análise me baseei em uma fonte muito interessante, mas relativamente pouco explorada, apesar de rica e gratuita: A API do Spotify. Pra quem não conhece o termo, API significa Interface de Programação de Aplicações (Application Programming Interface, em inglês) e se trata de um protocolo que permite que sistemas ou softwares troquem informações entre si. A API do Spotify permite acessar uma série de dados sobre músicas, álbuns, artistas e playlists disponíveis em sua plataforma, incluindo títulos, datas de lançamento, gêneros musicais dos artistas, gravadora de cada lançamento e métricas de popularidade. Também estão disponíveis alguns atributos acústicos, que traduzem características sonoras das músicas em números e dizem o quanto uma música é “energética” ou “dançante”, por exemplo.

Extraindo e organizando esses dados, podemos começar a interpretar as listas sob novas óticas e tentar responder algumas perguntas como: Será que as músicas dos álbuns listados têm ficado mais ou menos curtas, aceleradas, animadas ou eletrônicas ao longo do tempo? Quais gêneros musicais foram mais contemplados nas listas em cada ano? Como as gravadoras ou selos de participação mais frequente nas listas se diferem em termos artísticos, a partir dos parâmetros acústicos do Spotify? Será que os artistas mais bem posicionados na #listadaslistas também são mais populares? Quais são as músicas e artistas mais dançantes, ou de som mais acústico?

Se por um lado essas análises podem servir para tentar trazer uma luz sobre as preferências do jornalismo crítico musical no Brasil, por outro podem também evidenciar algumas características da produção musical nacional nos últimos anos, embora seja importante ressaltar que estamos aqui analisando apenas um recorte dos álbuns e artistas que alcançaram reconhecimento de parte da mídia especializada e qualquer tentativa de extrapolação dessas análises para o cenário musical brasileiro como um todo pode levar a conclusões precipitadas.

ENTENDENDO OS ATRIBUTOS DE ÁUDIO

Então, vamos às análises. De início, vamos explorar os atributos que o Spotify utiliza pra quantificar as músicas a partir da análise do áudio de cada uma delas. Alguns atributos têm um significado mais intuitivo que outros, então vou começar conceituando um a um e ilustrando com listas e playlists, considerando músicas e álbuns de todas as edições da #listadaslistas*. Assim podemos tentar “ouvir” como os algoritmos do Spotify atribuem esses valores**:

Energy: Representa uma percepção de intensidade. Músicas com Energy alto geralmente são mais rápidas, altas e ruidosas.

Álbuns com maior Energy médio

Posição Artista Álbum Energy Médio Lista
1 Autoramas Libido 0.976 2018
2 Ratos de Porão Século Sinistro 0.968 2014
3 Sepultura Machine Messiah 0.960 2017
4 Loomer You Wouldn’t Anyway 0.897 2013
5 Mc Carol Bandida 0.882 2016

Playlist das 20 músicas com maior Energy

Essa playlist acaba sendo dominada pelos álbuns de rock mais acelerado e com bastante distorção nas guitarras, intercalados por algumas músicas com pegada mais pop/funk de Linn da Quebrada e MC Carol.

Álbuns com menor Energy médio

Posição Artista Álbum Energy Médio Lista
1 MOMO. Cadafalso 0.129 2013
2 Romulo Fróes Barulho Feio 0.171 2014
3 Tim Bernardes Recomeçar 0.211 2017
4 Cadu Tenório Vozes 0.236 2014
5 Vitor Ramil Foi No Mês Que Vem 0.268 2013

Playlist das 20 músicas com menor Energy

Do outro lado do espectro de Energy vemos uma variedade maior no número de artistas, com faixas que são lentas e com pouquíssima instrumentação (muitas vezes apenas um violão). Acabou virando uma playlist ótima pra relaxar, ou até embalar uma soneca, como sugerem os títulos das músicas: “Cochilo”, “Fall Asleep” e “Cama”.

Valence: Mede a positividade da música. Faixas com Valence maior soam mais animadas, felizes, eufóricas, enquanto as com Valence menor soam mais negativas, ou tristes.

Álbuns com maior Valence médio

Posição Artista Álbum Valence Médio Lista
1 Tom Zé Canções Eróticas de Ninar 0.908 2016
2 Gang Do Eletro Gang Do Eletro 0.890 2013
3 Rafael Castro Um Chopp e um Sundae 0.872 2015
4 Felipe Cordeiro Se Apaixone pela Loucura do Seu Amor 0.836 2013
5 Tagore Movido a Vapor 0.804 2014

Playlist das 20 músicas com maior Valence

Importante lembrar que, apesar do Valence tentar atribuir uma medida de positividade das músicas, apenas o áudio é considerado, e não a letra, o que permite a presença nessa playlist de músicas com letras não tão positivas assim.

Álbuns com menor Valence médio

Posição Artista Álbum Valence Médio Lista
1 Herod Umbra 0.0882 2013
2 Cadu Tenório Vozes 0.0922 2014
3 ruído/mm A É Concavo, B É Convexo 0.0944 2018
4 Gorduratrans Paroxismos 0.0995 2017
5 maquinas Lado Turvo, Lugares Inquietos 0.1170 2016

Playlist das 20 músicas com menor Valence

Como oposto de positividade e felicidade, percebemos que o Spotify atribui valores baixos de Valence pra sons menos ritmados e com ambientação mais etérea.

Danceability: Busca descrever o quão adequada uma música é para dançar, baseando-se numa combinação de elementos musicais como andamento, batida, regularidade e estabilidade rítmica.

Posição Artista Álbum Danceability Médio Lista
1 Sombra Fantástico Mundo Popular 0.815 2013
2 Karol Conká Ambulante 0.784 2018
3 Tulipa Ruiz Tu 0.778 2017
4 Rincon Sapiência Galanga Livre 0.774 2017
5 Gang Do Eletro Gang Do Eletro 0.772 2013

Playlist das 20 músicas com maior Danceability

Logo na primeira faixa, a playlist começa a mostrar que o conceito de “adequado pra dançar” do algoritmo do Spotify parece priorizar ritmos mais marcados e constantes e ao invés de suingados, ou sincopados. Além disso, fica a impressão de que quanto mais altos e secos os elementos percussivos, maior a pontuação nesse atributo.

Álbuns com menor Danceability médio

Posição Artista Álbum Danceability Médio Lista
1 Bike Em Busca da Viagem Eterna 0.224 2017
2 Herod Umbra 0.226 2013
3 Kalouv Pluvero 0.234 2014
4 Gorduratrans Paroxismos 0.240 2017
5 Cadu Tenório Vozes 0.242 2014

Playlist das 20 músicas com menor Danceability

Speechiness: Detecta a presença de palavras faladas num áudio. Quanto maior a proporção de falas, ao invés de melodias cantadas, maior o valor de Speechiness de uma música.

Álbuns com maior Speechiness médio

Posição Artista Álbum Speechiness Médio Lista
1 Rashid Crise 0.415 2018
2 Baco Exu do Blues Bluesman 0.391 2018
3 Djonga Heresia 0.387 2017
4 Djonga O MENINO QUE QUERIA SER DEUS 0.366 2018
5 Nill Regina 0.336 2017

Playlist das 20 músicas com maior Speechiness

Naturalmente, Rap, Trap e Hip Hop tendem a receber valores mais altos no Speechiness. Interessante notar que os 5 álbuns no topo da lista pertencem às duas últimas edições do #listadaslistas (2017 e 2018). Potencialmente uma tendência recente que vamos explorar mais abaixo.

Álbuns com menor Speechiness médio

Posição Artista Álbum Speechiness Médio Lista
1 Carne Doce Carne Doce 0.0882 2013
2 Guilherme Arantes Flores & Cores 0.0922 2014
3 Guilherme Arantes Condição Humana (Sobre o Tempo) 0.0944 2018
4 Bilhão Bilhão 0.0995 2017
5 Ná Ozzetti, Zé Miguel Wisnik Ná e Zé 0.1170 2016

Playlist das 20 músicas com menor Speechiness

Essa foi, provavelmente, a playlist que mais me surpreendeu. Não esperava encontrar uma coesão nela até começar a ouví-la. Além de bastante melódicas (o que não é grande surpresa), as músicas dela são majoritariamente suaves, leves e mais lentas que a média geral. O porquê e disso eu ainda não tenho certeza, mas ela acabou virando uma playlist bem interessante, que passaria tranquilamente como feita por um curador humano.

Outros atributos que serão utilizados nas análises seguintes:

Acousticness: Um valor de confiança de se uma música tem em sua instrumentação elementos majoritariamente acústicos, e não eletrônicos. Quanto maior o valor, maior a confiança de que a música é acústica.

Instrumentalness: Prevê se uma música possui elementos vocais. Quanto maior o valor, maior a probabilidade da música não conter conteúdo vocal, seja falado ou cantado.

Liveness: Busca detectar a presença de público na gravação. Valores maiores representam uma probabilidade maior de que a música tenha sido gravada ao vivo.

Loudness: Mede, em decibéis, a percepção de volume geral de uma faixa.

Mode: Diz respeito à harmonia, ou tipo de escala da música (maior, ou menor).

Tempo: Uma estimativa do andamento, ou velocidade da batida da música, medida em BPM (batidas por minuto).

CORRELAÇÃO ENTRE ATRIBUTOS

Quando comparamos os valores desses atributos dois a dois, é interessante perceber que alguns deles estão correlacionados. Por exemplo, músicas mais “dançantes”, segundo o Spotify, também costumam receber valores maiores de Valence (positividade), como mostrao gráfico abaixo, onde cada ponto é uma música posicionada a partir de seus valores de Valence e Danceability. A linha roxa resume a correlação:

Encontramos uma correlação evidente também quando comparamos Loudness e Energy:

Já quando cruzamos os andamentos das músicas com os seus valores de Danceability, percebemos que, conforme o andamento aumenta, as músicas tendem a ganhar em Danceability, até o BPM chegar próximo a 110, quando então o Danceability começa a diminuir. Esse pico no gráfico aponta um BPM mais “dançável” de acordo com o algoritmo que calcula esse atributo, embora ele seja influenciado por muitos outros fatores também.

TENDÊNCIAS

Aqui chegamos a uma das partes mais interessantes da análise. Observando médias e distribuições desses atributos separadamente para cada edição da #listadaslistas, podemos começar a notar algumas variações e tendências ao longo do tempo.

A variação mais evidente encontrada diz respeito ao Speechiness. O Spotify diz na documentação da sua API que áudios com Speechiness maior do que 0.33 possuem grande probabilidade de conter palavras faladas. Como vimos anteriormente, no nosso contexto isso geralmente aponta para faixas com elementos de Rap. O gráfico abaixo mostra a proporção de faixas com Speechiness maior do que 0.33 em cada edição da #listadaslistas e aponta um salto considerável a partir de 2016. Um indício de que o Rap passou a ter mais espaço nas listas desde então.

Proporção de faixas com Speechiness maior que 0.33

Em relação ao Valence, que mede a positividade das músicas, a média dos dois últimos anos apresentam uma diminuição em relação aos demais, depois de um pico em 2016.

Média de Valence

Outra variação interessante é a do número de faixas por álbum, que na média tem caído levemente ano a ano, mostrando que os álbuns mais listados tendem a ficar mais curtos com o tempo.

Média de número de faixas dos álbuns

Observando as datas em que cada álbum foi lançado, podemos procurar pelos períodos com maior ou menor número de lançamentos.

Enquanto as épocas de começo e fim de ano são mais evitadas, o período de agosto a outubro traz uma grande concentração de lançamentos, com setembro como o mês preferido, considerando os álbuns listados. E, com exceção de 2013, houve em todos os anos uma quantidade consideravelmente maior de lançamentos no segundo semestre do que no primeiro, como mostram os gráficos abaixo.

Quantidade de álbuns lançados em cada mês

Quantidade de álbuns lançados em cada semestre

POPULARIDADE

Outro atributo interessante que o Spotify usa pra classificar as músicas e artistas é o Popularity. Na documentação da API não é explicado no detalhe como esse atributo é calculado, apenas é informado que o algoritmo atribui uma medida de popularidade aos artistas, álbuns e músicas, levando em conta quantidade de plays de cada um e a data em que esses plays aconteceram (quanto mais recente o play, maior a contribuição para o score de Popularity). Podemos, então, começar a buscar quais fatores estariam relacionados à popularidade de artistas e de seus trabalhos.

De início, comparamos as posições dos álbuns nos rankings finais das edições da #listadaslistas com o Popularity de cada um deles. Como vemos no gráfico abaixo, fica evidente uma correlação entre os dois fatores, demonstrando que álbuns mais bem posicionados, especialmente os das 25 primeiras posições, tendem a ter índices de Popularity maior.

Popularity médio dos álbuns para cada posição na #listadaslistas

Importante ressaltar que isso não significa necessariamente que um fator está causando o outro. É possível que uma posição melhor na #listadaslistas faça com que mais pessoas ouçam o álbum, aumentando seu índice Popularity, assim como é possível que álbuns mais populares tenham maior chance de serem lembrados pelos criadores de listas de melhores do ano. Da mesma forma que é possível que nenhum seja causador do outro de forma significante, mas que outros fatores, não medidos aqui, como uma boa campanha de divulgação, influenciem paralelamente tanto o Popularity, quanto a aparição nas listas de cada álbum, gerando essa correlação.

Alguns dos atributos de áudio também apresentam correlacão com Popularity, ao menos dentro do universo de álbuns presentes na #listadaslistas. Álbuns com maior média de Danceability, ou Speechiness tendem a ter maior Popularity, já com Instrumentalness acontece o contrário.

Danceability médio por Popularity de cada álbum

Speechiness médio por Popularity de cada álbum

Instrumentalness médio por Popularity de cada álbum

E quando comparamos a posição de cada faixa no álbum, com seu valor de Popularity é possível perceber que quanto mais cedo uma música aparece no álbum, maior costuma ser sua popularidade.

Popularity médio para cada posição de música no álbum

NOS PRÓXIMOS CAPÍTULOS

Na segunda parte das análises dos dados do Spotify sobre os álbuns presentes nas edições de 2013 a 2018 da #listadaslistas, vou agrupar os álbuns por gênero musical e por gravadoras/selos e comparar como esses grupos se diferenciam entre si, buscando identificar as características mais marcantes de cada um e como a presença deles tem variado em cada edição da #listadaslistas. O novo artigo deve sair nas próximas semanas.

E, mais pra frente, pretendo analisar como esse conjunto de músicas dos álbuns mais listados pela crítica se compara com os rankings das músicas nacionais mais tocadas no Spotify e nas rádios, novamente a partir dos dados disponíveis na API do Spotify.

FONTE: lumiolab.com

Até a próxima!

* Alguns álbuns não estavam disponíveis no Spotify no momento de coleta de dados para a criação desse artigo e, portanto, não puderam ser considerados nas análises. São eles: “Dorgas” de Dorgas, “Tribunal do Feicebuqui” de Tom Zé, “Issamu Minami” de Ceticências,  “Grão” de Fábrica, “Beija Flors Velho E Sujo” de São Paulo Underground e “Niños Heroes” de Negro Leo.

** Foram desconsideradas nessas playlists apenas as músicas com menos de 1 minuto e meio, para filtrar faixas como interlúdios e vinhetas, que tendem a fugir dos padrões do resto das músicas dos álbuns e acabam não representando tão bem os atributos que gostaria de ilustrar aqui.