Wie funktionieren Musikidentifikations-Apps wie Shazam?


Musik-ID-Apps scheinen zunächst magisch, aber unter der Haube verbirgt sich ein ausgefallener Algorithmus, mit dem Songs sofort gefunden werden können. So funktionieren sie.

Die Magie der musikalischen Identifikation

Es ist wahrscheinlich uns allen passiert. Sie speisen in einem schönen Restaurant, hängen in einem Café ab oder gehen durch ein Geschäft, wenn Sie plötzlich ein gutes Lied über die Lautsprecher hören. Vielleicht ist es ein Lied, das Sie zuvor gehört haben, oder ein Titel, den Sie noch nie gehört haben. Also ziehen Sie Ihr Telefon heraus, öffnen Shazam und halten Ihr Gerät an die Decke. Die App sagt Ihnen blitzschnell, was der Song ist, wer der Künstler ist und wo Sie ihn streamen können.

Sie sind schnell, bemerkenswert präzise und können selbst die dunkelsten Songs identifizieren. Kurz gesagt, sie isolieren den Song von einer Aufnahme und suchen ihn in einer großen Datenbank mit Titeln. Die Technologie dahinter ist jedoch recht komplex und beeindruckend.

Es könnte Sie schockieren, dass die heute bekannte Shazam-App im Jahr 2002 gestartet wurde und das System genauso genau und schnell war wie damals. All dies dank eines einzigartigen Algorithmus, der die Welt der Musik revolutionieren würde.

Es sind nicht nur die Texte

Auf den ersten Blick scheinen Musikidentifikations-Apps wie Shazam unkompliziert zu sein. Sie könnten denken, dass sie sich wie jeder Sprachassistent nur die Texte anhören und sie in einer Songtexte-Datenbank nachschlagen, um Ihnen zu sagen, was der Song ist.

Die meisten Musikidentifikations-Apps können jedoch den Titel eines Instrumentals oder sogar den Sänger eines Coversongs erkennen. Anstatt die Texte des Tracks zu analysieren, suchen sie in ihren umfangreichen Datenbanken nach „Fingerabdrücken“, die für jeden Song spezifisch sind.

Demnächst: So zeigen Sie Songtexte auf iPhone, iPad, Mac oder Apple TV an

Fingerabdrucktechnologie

Shazam auf einem iPhone X.

Sie haben wahrscheinlich Geräte, die mit Ihrem Fingerabdruck entsperrt werden können. Dies ist die Anordnung der kleinen Linien an Ihrem Finger, die für Sie einzigartig sind. Wenn Sie Ihr Mikrofon gedrückt halten, um einen kurzen Ausschnitt eines Songs aufzunehmen, wird dieser Clip in Datenmodelle umgewandelt, nach denen Shazam oder eine andere App in ihrer Datenbank suchen können.

Auf den ersten Blick scheint diese Methode für mehrere Probleme anfällig zu sein. Die meiste Zeit, in der Sie Musik in der Öffentlichkeit hören, treten durch die Lautsprecher Hintergrundgeräusche und Verzerrungen auf, die dazu führen können, dass Songs nicht mehr identifiziert werden können oder ungenaue Übereinstimmungen auftreten. Darüber hinaus werden selbst in einem kurzen Audioclip viele Daten erfasst, was die Suche nach diesen Mustern in einer Datenbank mit Millionen von Songs verlangsamen kann.

verbunden :  So finden Sie die Bildschirmauflösung Ihres Mac

In einem Interview mit Amerikanischer Wissenschaftler 2003 erklärt Avery Li-Chun Wang, Chef-Datenwissenschaftler und Mitbegründer von Shazam, wie ihr Algorithmus diese Probleme löst. Die Informationen eines Audioclips können mit einem 3D-Diagramm visualisiert werden, das als Spektrogramm bezeichnet wird und eine Änderung der Frequenzen über einen bestimmten Zeitraum darstellt. Es berücksichtigt auch die Amplitude, dh die Stärke eines Klangs. Dies wird in einem Spektrogramm unter Verwendung der Intensität der Farbe dargestellt.

Shazam Musikspektrogramm

Auf die gleiche Weise, wie Menschen Geräusche nur dann wahrnehmen können, wenn sie sich auf einer bestimmten Frequenz befinden, anstatt ein ganzes Lied bei einer Suche zu berücksichtigen, berücksichtigt Shazam nur ” Peaks “, der höchste Energiegehalt in einem Audioclip. . Die erfassten Fingerabdrücke nehmen nur die höchsten Frequenzpunkte in einer bestimmten Zeitspanne und dann die Spitzenamplitudenpunkte in diesen Frequenzen.

In einem Forschungsbericht für Universität von ColumbiaWang sagte, dass die Methode es ihnen ermöglicht, die meisten unnötigen Teile eines Audioclips wie Hintergrundgeräusche zu entfernen und Verzerrungen zu beseitigen. Außerdem sind die Impressionen so klein, dass es nur wenige Millisekunden dauert, um einen Song aus der großen Datenbank zu identifizieren.

Shazams Einfluss

Musikidentifikations-Apps sind nicht nur für durchschnittliche Hörer nützlich, die ein Lied hören, das sie lieben, sondern sie gestalten auch die Musikwelt mit.

Radiosender und Streaming-Dienste verwenden häufig Daten darüber, wonach die Menschen am meisten shazamieren, um zu bestimmen, welche Titel vom Publikum gehört werden. Dies ist nützlich, da es den eingängigen Charakter und die potenzielle Beliebtheit eines Songs unabhängig vom Künstler anzeigt. Wenn Sie ein Lied mit der App markieren, sehen Sie sofort, wie viele Personen versucht haben, es ebenfalls zu markieren.

Soundhound Musikidentifikation

Seit Shazams Machtantritt sind auch eine Handvoll Konkurrenten aufgetaucht. Soundhound behauptet, ein Lied einfach durch Singen oder Summen identifizieren zu können, mit gemischten Ergebnissen. In Sprach-Apps wie Google Assistant ist auch eine Song-ID integriert, die dem Shazam-System sehr ähnlich ist.

Demnächst: Die besten Seiten, um kostenlose Musik zu streamen

Moyens Staff
Moyens I/O-Personal. motivierte Sie und gab Ratschläge zu Technologie, persönlicher Entwicklung, Lebensstil und Strategien, die Ihnen helfen werden.
We would like to show you notifications for the latest news and updates.
Dismiss
Allow Notifications