Дослідники сервісу потокового відтворення музики Deezer розробили штучний інтелект, здатний визначати настрій та інтенсивність музичних композицій. Відповідна робота була опублікована на arXiv.org.
Для визначення настрою треків дослідники врахували як аудіосигнал, так і тексти пісень. Спершу вони подають звукові сигнали в нейронну мережу разом з моделями, які реконструюють лінгвістичний контекст слів.
Потім, з метою навчання, штучний інтелект отримує базу Million Song з метаданих понад один мільйон сучасних аудіокомпозицій. Зокрема, фахівці з Dezeer задіяли базу Last.fm, в якій трекам присвоюються ідентифікатори з більш ніж 500 тисячами унікальних тегів.
База Million Song містить тільки метадані, а тому дослідники пов’язали отриману інформацію з каталогом Dezeer за допомогою ідентифікаторів, як назва пісні, альбому і виконавця. Близько 60 відсотків отриманого набору даних (18 644 треки) були використані для тренування штучного інтелекту, а решта 40 відсотків будуть використані для перевірки і подальшого тестування.
Виконана робота допоможе вивчити, як музика, тексти і настрій пісень корелюють між собою.
Leave a Comment