2019 vai se aproximando do fim e logo vamos começar a esbarrar naquelas celebradas listas dos melhores álbuns brasileiros do ano. Em 2013 esse tipo de publicação virou objeto de estudo de Pena Schmidt, renomado produtor, consultor e pesquisador musical. Reunindo colaboradores como Elson Barbosa, do selo Sinewave?, Rafael Chioccarello, do site Hits Perdidos, e os sócios Juliano Polimeno e Daniel Cukier, da plataforma de análise de dados musicais Playax, Pena passou a consolidar essas listas, ano a ano, num projeto denominado #listadaslistas, que evidencia os trabalhos com maior número de aparições nas seleções de sites e blogs. Com edições de 2013 a 2018, a #listadaslistas passou a oferecer aos profissionais do mercado musical e ao público uma perspectiva nova sobre como jornalistas e críticos têm avaliado a produção musical nacional nos últimos anos (mais sobre o projeto aqui).
Refletindo sobre que tipo de valor um projeto desses pode gerar, especialmente para quem participa e/ou se interessa pela indústria musical, e buscando um objeto de estudo que unisse duas paixões minhas – música e ciência de dados – decidi dedicar uma parte do meu tempo livre para explorar mais a fundo quais informações e interpretações seria possível extrair da #listadaslistas, a partir da junção com outras fontes de dados.
E que tipo de dados estamos falando aqui? Bom, para essa análise me baseei em uma fonte muito interessante, mas relativamente pouco explorada, apesar de rica e gratuita: A API do Spotify. Pra quem não conhece o termo, API significa Interface de Programação de Aplicações (Application Programming Interface, em inglês) e se trata de um protocolo que permite que sistemas ou softwares troquem informações entre si. A API do Spotify permite acessar uma série de dados sobre músicas, álbuns, artistas e playlists disponíveis em sua plataforma, incluindo títulos, datas de lançamento, gêneros musicais dos artistas, gravadora de cada lançamento e métricas de popularidade. Também estão disponíveis alguns atributos acústicos, que traduzem características sonoras das músicas em números e dizem o quanto uma música é “energética” ou “dançante”, por exemplo.
Extraindo e organizando esses dados, podemos começar a interpretar as listas sob novas óticas e tentar responder algumas perguntas como: Será que as músicas dos álbuns listados têm ficado mais ou menos curtas, aceleradas, animadas ou eletrônicas ao longo do tempo? Quais gêneros musicais foram mais contemplados nas listas em cada ano? Como as gravadoras ou selos de participação mais frequente nas listas se diferem em termos artísticos, a partir dos parâmetros acústicos do Spotify? Será que os artistas mais bem posicionados na #listadaslistas também são mais populares? Quais são as músicas e artistas mais dançantes, ou de som mais acústico?
Se por um lado essas análises podem servir para tentar trazer uma luz sobre as preferências do jornalismo crítico musical no Brasil, por outro podem também evidenciar algumas características da produção musical nacional nos últimos anos, embora seja importante ressaltar que estamos aqui analisando apenas um recorte dos álbuns e artistas que alcançaram reconhecimento de parte da mídia especializada e qualquer tentativa de extrapolação dessas análises para o cenário musical brasileiro como um todo pode levar a conclusões precipitadas.
ENTENDENDO OS ATRIBUTOS DE ÁUDIO
Então, vamos às análises. De início, vamos explorar os atributos que o Spotify utiliza pra quantificar as músicas a partir da análise do áudio de cada uma delas. Alguns atributos têm um significado mais intuitivo que outros, então vou começar conceituando um a um e ilustrando com listas e playlists, considerando músicas e álbuns de todas as edições da #listadaslistas*. Assim podemos tentar “ouvir” como os algoritmos do Spotify atribuem esses valores**:
Energy: Representa uma percepção de intensidade. Músicas com Energy alto geralmente são mais rápidas, altas e ruidosas.
Álbuns com maior Energy médio
Posição | Artista | Álbum | Energy Médio | Lista |
1 | Autoramas | Libido | 0.976 | 2018 |
2 | Ratos de Porão | Século Sinistro | 0.968 | 2014 |
3 | Sepultura | Machine Messiah | 0.960 | 2017 |
4 | Loomer | You Wouldn’t Anyway | 0.897 | 2013 |
5 | Mc Carol | Bandida | 0.882 | 2016 |
Playlist das 20 músicas com maior Energy
Álbuns com menor Energy médio
Posição | Artista | Álbum | Energy Médio | Lista |
1 | MOMO. | Cadafalso | 0.129 | 2013 |
2 | Romulo Fróes | Barulho Feio | 0.171 | 2014 |
3 | Tim Bernardes | Recomeçar | 0.211 | 2017 |
4 | Cadu Tenório | Vozes | 0.236 | 2014 |
5 | Vitor Ramil | Foi No Mês Que Vem | 0.268 | 2013 |
Playlist das 20 músicas com menor Energy
Valence: Mede a positividade da música. Faixas com Valence maior soam mais animadas, felizes, eufóricas, enquanto as com Valence menor soam mais negativas, ou tristes.
Álbuns com maior Valence médio
Posição | Artista | Álbum | Valence Médio | Lista |
1 | Tom Zé | Canções Eróticas de Ninar | 0.908 | 2016 |
2 | Gang Do Eletro | Gang Do Eletro | 0.890 | 2013 |
3 | Rafael Castro | Um Chopp e um Sundae | 0.872 | 2015 |
4 | Felipe Cordeiro | Se Apaixone pela Loucura do Seu Amor | 0.836 | 2013 |
5 | Tagore | Movido a Vapor | 0.804 | 2014 |
Playlist das 20 músicas com maior Valence
Álbuns com menor Valence médio
Posição | Artista | Álbum | Valence Médio | Lista |
1 | Herod | Umbra | 0.0882 | 2013 |
2 | Cadu Tenório | Vozes | 0.0922 | 2014 |
3 | ruído/mm | A É Concavo, B É Convexo | 0.0944 | 2018 |
4 | Gorduratrans | Paroxismos | 0.0995 | 2017 |
5 | maquinas | Lado Turvo, Lugares Inquietos | 0.1170 | 2016 |
Playlist das 20 músicas com menor Valence
Danceability: Busca descrever o quão adequada uma música é para dançar, baseando-se numa combinação de elementos musicais como andamento, batida, regularidade e estabilidade rítmica.
Posição | Artista | Álbum | Danceability Médio | Lista |
1 | Sombra | Fantástico Mundo Popular | 0.815 | 2013 |
2 | Karol Conká | Ambulante | 0.784 | 2018 |
3 | Tulipa Ruiz | Tu | 0.778 | 2017 |
4 | Rincon Sapiência | Galanga Livre | 0.774 | 2017 |
5 | Gang Do Eletro | Gang Do Eletro | 0.772 | 2013 |
Playlist das 20 músicas com maior Danceability
Álbuns com menor Danceability médio
Posição | Artista | Álbum | Danceability Médio | Lista |
1 | Bike | Em Busca da Viagem Eterna | 0.224 | 2017 |
2 | Herod | Umbra | 0.226 | 2013 |
3 | Kalouv | Pluvero | 0.234 | 2014 |
4 | Gorduratrans | Paroxismos | 0.240 | 2017 |
5 | Cadu Tenório | Vozes | 0.242 | 2014 |
Playlist das 20 músicas com menor Danceability
Álbuns com maior Speechiness médio
Posição | Artista | Álbum | Speechiness Médio | Lista |
1 | Rashid | Crise | 0.415 | 2018 |
2 | Baco Exu do Blues | Bluesman | 0.391 | 2018 |
3 | Djonga | Heresia | 0.387 | 2017 |
4 | Djonga | O MENINO QUE QUERIA SER DEUS | 0.366 | 2018 |
5 | Nill | Regina | 0.336 | 2017 |
Playlist das 20 músicas com maior Speechiness
Álbuns com menor Speechiness médio
Posição | Artista | Álbum | Speechiness Médio | Lista |
1 | Carne Doce | Carne Doce | 0.0882 | 2013 |
2 | Guilherme Arantes | Flores & Cores | 0.0922 | 2014 |
3 | Guilherme Arantes | Condição Humana (Sobre o Tempo) | 0.0944 | 2018 |
4 | Bilhão | Bilhão | 0.0995 | 2017 |
5 | Ná Ozzetti, Zé Miguel Wisnik | Ná e Zé | 0.1170 | 2016 |
Playlist das 20 músicas com menor Speechiness
Outros atributos que serão utilizados nas análises seguintes:
Acousticness: Um valor de confiança de se uma música tem em sua instrumentação elementos majoritariamente acústicos, e não eletrônicos. Quanto maior o valor, maior a confiança de que a música é acústica.
Instrumentalness: Prevê se uma música possui elementos vocais. Quanto maior o valor, maior a probabilidade da música não conter conteúdo vocal, seja falado ou cantado.
Liveness: Busca detectar a presença de público na gravação. Valores maiores representam uma probabilidade maior de que a música tenha sido gravada ao vivo.
Loudness: Mede, em decibéis, a percepção de volume geral de uma faixa.
Mode: Diz respeito à harmonia, ou tipo de escala da música (maior, ou menor).
Tempo: Uma estimativa do andamento, ou velocidade da batida da música, medida em BPM (batidas por minuto).
CORRELAÇÃO ENTRE ATRIBUTOS
Quando comparamos os valores desses atributos dois a dois, é interessante perceber que alguns deles estão correlacionados. Por exemplo, músicas mais “dançantes”, segundo o Spotify, também costumam receber valores maiores de Valence (positividade), como mostrao gráfico abaixo, onde cada ponto é uma música posicionada a partir de seus valores de Valence e Danceability. A linha roxa resume a correlação:

Encontramos uma correlação evidente também quando comparamos Loudness e Energy:

Já quando cruzamos os andamentos das músicas com os seus valores de Danceability, percebemos que, conforme o andamento aumenta, as músicas tendem a ganhar em Danceability, até o BPM chegar próximo a 110, quando então o Danceability começa a diminuir. Esse pico no gráfico aponta um BPM mais “dançável” de acordo com o algoritmo que calcula esse atributo, embora ele seja influenciado por muitos outros fatores também.

TENDÊNCIAS
Aqui chegamos a uma das partes mais interessantes da análise. Observando médias e distribuições desses atributos separadamente para cada edição da #listadaslistas, podemos começar a notar algumas variações e tendências ao longo do tempo.
A variação mais evidente encontrada diz respeito ao Speechiness. O Spotify diz na documentação da sua API que áudios com Speechiness maior do que 0.33 possuem grande probabilidade de conter palavras faladas. Como vimos anteriormente, no nosso contexto isso geralmente aponta para faixas com elementos de Rap. O gráfico abaixo mostra a proporção de faixas com Speechiness maior do que 0.33 em cada edição da #listadaslistas e aponta um salto considerável a partir de 2016. Um indício de que o Rap passou a ter mais espaço nas listas desde então.
Proporção de faixas com Speechiness maior que 0.33

Em relação ao Valence, que mede a positividade das músicas, a média dos dois últimos anos apresentam uma diminuição em relação aos demais, depois de um pico em 2016.
Média de Valence

Outra variação interessante é a do número de faixas por álbum, que na média tem caído levemente ano a ano, mostrando que os álbuns mais listados tendem a ficar mais curtos com o tempo.
Média de número de faixas dos álbuns

Observando as datas em que cada álbum foi lançado, podemos procurar pelos períodos com maior ou menor número de lançamentos.
Enquanto as épocas de começo e fim de ano são mais evitadas, o período de agosto a outubro traz uma grande concentração de lançamentos, com setembro como o mês preferido, considerando os álbuns listados. E, com exceção de 2013, houve em todos os anos uma quantidade consideravelmente maior de lançamentos no segundo semestre do que no primeiro, como mostram os gráficos abaixo.
Quantidade de álbuns lançados em cada mês

Quantidade de álbuns lançados em cada semestre

POPULARIDADE
Outro atributo interessante que o Spotify usa pra classificar as músicas e artistas é o Popularity. Na documentação da API não é explicado no detalhe como esse atributo é calculado, apenas é informado que o algoritmo atribui uma medida de popularidade aos artistas, álbuns e músicas, levando em conta quantidade de plays de cada um e a data em que esses plays aconteceram (quanto mais recente o play, maior a contribuição para o score de Popularity). Podemos, então, começar a buscar quais fatores estariam relacionados à popularidade de artistas e de seus trabalhos.
De início, comparamos as posições dos álbuns nos rankings finais das edições da #listadaslistas com o Popularity de cada um deles. Como vemos no gráfico abaixo, fica evidente uma correlação entre os dois fatores, demonstrando que álbuns mais bem posicionados, especialmente os das 25 primeiras posições, tendem a ter índices de Popularity maior.
Popularity médio dos álbuns para cada posição na #listadaslistas

Importante ressaltar que isso não significa necessariamente que um fator está causando o outro. É possível que uma posição melhor na #listadaslistas faça com que mais pessoas ouçam o álbum, aumentando seu índice Popularity, assim como é possível que álbuns mais populares tenham maior chance de serem lembrados pelos criadores de listas de melhores do ano. Da mesma forma que é possível que nenhum seja causador do outro de forma significante, mas que outros fatores, não medidos aqui, como uma boa campanha de divulgação, influenciem paralelamente tanto o Popularity, quanto a aparição nas listas de cada álbum, gerando essa correlação.
Alguns dos atributos de áudio também apresentam correlacão com Popularity, ao menos dentro do universo de álbuns presentes na #listadaslistas. Álbuns com maior média de Danceability, ou Speechiness tendem a ter maior Popularity, já com Instrumentalness acontece o contrário.
Danceability médio por Popularity de cada álbum

Speechiness médio por Popularity de cada álbum

Instrumentalness médio por Popularity de cada álbum

E quando comparamos a posição de cada faixa no álbum, com seu valor de Popularity é possível perceber que quanto mais cedo uma música aparece no álbum, maior costuma ser sua popularidade.
Popularity médio para cada posição de música no álbum

NOS PRÓXIMOS CAPÍTULOS
Na segunda parte das análises dos dados do Spotify sobre os álbuns presentes nas edições de 2013 a 2018 da #listadaslistas, vou agrupar os álbuns por gênero musical e por gravadoras/selos e comparar como esses grupos se diferenciam entre si, buscando identificar as características mais marcantes de cada um e como a presença deles tem variado em cada edição da #listadaslistas. O novo artigo deve sair nas próximas semanas.
E, mais pra frente, pretendo analisar como esse conjunto de músicas dos álbuns mais listados pela crítica se compara com os rankings das músicas nacionais mais tocadas no Spotify e nas rádios, novamente a partir dos dados disponíveis na API do Spotify.
FONTE: lumiolab.com
Até a próxima!
* Alguns álbuns não estavam disponíveis no Spotify no momento de coleta de dados para a criação desse artigo e, portanto, não puderam ser considerados nas análises. São eles: “Dorgas” de Dorgas, “Tribunal do Feicebuqui” de Tom Zé, “Issamu Minami” de Ceticências, “Grão” de Fábrica, “Beija Flors Velho E Sujo” de São Paulo Underground e “Niños Heroes” de Negro Leo.
** Foram desconsideradas nessas playlists apenas as músicas com menos de 1 minuto e meio, para filtrar faixas como interlúdios e vinhetas, que tendem a fugir dos padrões do resto das músicas dos álbuns e acabam não representando tão bem os atributos que gostaria de ilustrar aqui.