iFlytek – Marktführer in China im Bereich Spracherkennung

Eines der weltweit 50 innovativsten Unternehmen im Bereich künstlicher Intelligenz 

iFlytek ist mit einem Marktanteil von über 70 Prozent Chinas Marktführer in Sachen Spracherkennung. Das in Hefei ansässige Unternehmen expandiert derzeit sehr stark in der Sprachsteuerungstechnologie für Automobile, Smart-Home-Anwendungen, Roboter und Lehrmittel. Außerdem investierten die Chinesen in ein Start-up für Haushaltsroboter und etablierten ein Joint Venture, das sich mit der Entwicklung von Lehrmitteln befasst, die eine Echtzeitübersetzungsfunktion beinhalten. Mehr als als 160.000 Entwickler weltweit sollen die Software von iFlytek nutzen, über 400 Millionen Menschen die Produkte des chinesischen Technologieunternehmens.

Entstehungsgeschichte

Im Jahr 1937 wurde Julian Chen in Shanghai geboren. Er studierte Englisch, Russisch und Mandarin. Später lernte er Französisch, Deutsch und Japanisch. Nach einigen Jahren im Arbeitslager unter der Säuberungs-Ära Mao Zedongs, nahm Chen an einem internationalen Austauschprogramm teil. Er zog in die USA und promovierte an der Columbia University in Physik und erhielt einen Job bei IBM. IBM hatte einige der weltweit ersten Spracherkennungssoftware entwickelt und suchte 1994 jemanden, der sie an Mandarin anpasste. Chen entwickelte die Software ViaVoice und stellte diese in China an einer Sprachtechnologiekonferenz vor. Unter den begeisterten Zuschauern war auch Liu Qingfeng, ein 26-jähriger Doktorand in einem Spracherkennungslabor an der angesehenen chinesischen Universität für Wissenschaft und Technologie (USTC) in Hefei.
Noch während seinem Studium gründete Liu im Jahr 1999 die Sprachcomputerfirma namens iFlytek. Das junge Start-up hatte das Ziel, zum weltweit größten Anbieter von phonetischer Technik für Chinesisch zu werden. „Damals haben wir unsere Geldmittel hauptsächlich für technische Forschung eingesetzt. Vor der ersten Finanzierung hatten wir nur 200.000 Yuan auf dem Firmenkonto, doch die monatlichen Ausgaben beliefen sich auf über 300.000 Yuan. Finanziell konnten wir uns kaum über Wasser halten. Einige Mitbegründer spielten sogar mit dem Gedanken, das Handtuch zu werfen“, erzählt das Ausnahmetalent Liu. Die ersten fünf Jahre wurden Verluste eingefahren. Erst im Jahr 2004 wurde eine ausgeglichene Bilanz erzielt.
Im Jahr 2006 nahm iFlytek erstmals an der fachspezifischen „Blizzard Competition“ teil und ging als Überraschungssieger hervor.
Im Jahr 2008 gelang in Shenzhen der Börsengang. iFLYTEK war damit das erste von Hochschulstudenten noch während des Studiums gegründete chinesische Unternehmen, das an der Börse notiert wurde. Mit 70% Marktanteil ist iFlytek heute der Marktführer in China.
Im Oktober 2019 wurde iFlytek von den Vereinigten Staaten sanktioniert, weil es seine Technologie angeblich für Menschenrechtsverletzungen in Xinjiang eingesetzt hatte. Die im Jahr 2018 unterzeichnete fünfjährige Zusammenarbeitsvereinbarung mit dem MIT-Labor für Informatik und künstliche Intelligenz wurde daher in 2020 wieder gekündigt. 

Exkurs: Als Schriftsprache im Computerzeitalter stellte das Chinesische lange Zeit eine einzigartige Herausforderung dar: Es gab keine Möglichkeit, seine über 50.000 Zeichen auf einer Tastatur einzugeben. In den 1980er Jahren, als die ersten PCs in China aufkamen, hatten sich Programmierer mehrere Umgehungsmöglichkeiten ausgedacht. Die gebräuchlichste Methode war Pinyin, das System der romanisierten Rechtschreibung für Mandarin. Bei dieser Methode tippt man, um Katze zu schreiben „m-a-o“ und wählt dann 猫 aus einem Dropdown-Menü, das auch Zeichen für „Handel“ und „Hut“ sowie den Familiennamen von Mao Zedong enthält. Da Mandarin so viele Homophone hat, wurde das Tippen zu einer ineffizienten Übung bei der Wortwahl.

Erfolge

Liu Qingfeng: „ Die Zukunft der KI kann ein Roboter, ein Avatar oder eine Tasse sein. Aber ihr Hintergrund und ihr tiefes Lernen oder die Gehirnwissenschaft der Zukunft sind genauso wichtig wie Wasser und Elektrizität. Daher konzentrieren wir uns auf die Entwicklung des Backends.“

Sein Unternehmen hat den ersten Roboter entwickelt, der eine Ärzteprüfung bestanden hat, und dominiert in China den Markt für Spracherkennung.

iFlytek ging 2008 an die Börse und brachte 2010 die Anwendung iFlytek Input, auf den Markt. Im selben Jahr begann das iPhone Siri zu tragen, die von SRI International entwickelt und von Apple übernommen worden war. Doch während Siri ein „persönlicher Assistent“ war – ein sprechender digitaler Concierge, der Fragen beantworten konnte – war iFlytek Input weitaus fokussierter. Sie ermöglichte es den Menschen, überall auf ihrem Telefon Text zu diktieren: in einer E-Mail, bei einer Websuche oder im WeChat, der Super-App, die in China sowohl bei der Arbeit als auch beim Spielen dominiert.

Wie jede Technologie, die auf die Interaktion mit der menschlichen Sprache trainiert wurde, war Input anfangs ungenau. Aber als die Daten aus den Interaktionen der tatsächlichen Benutzer mit der App einzuspeisen begannen, verbesserte sich die Genauigkeit der Eingabe bei der Transkription von Sprache in Text dramatisch.

Parallel trainierte das Unternehmen einen Großteil seiner KI für eine andere Herausforderung: die Bereitstellung von Echtzeit-Übersetzungen, um Benutzern zu helfen, Sprecher anderer Dialekte und Sprachen zu verstehen. Spätere Versionen von Input ermöglichten es den Benutzern, ihre persönlichen Gespräche zu übersetzen und Untertitel von Telefongesprächen in 23 chinesischen Dialekten und vier Fremdsprachen zu erhalten. Mit der großen Bevölkerungszahl Chinas konnte das Unternehmen riesige Datenmengen sammeln. Täglich versenden WeChat-Nutzer rund 6 Milliarden Sprachtexte (2017).

Im Jahr 2017 wurde iFlytek vom MIT Technology Review in die Liste der 50 smartesten Unternehmen der Welt aufgenommen, und die chinesische Regierung verlieh iFlytek einen begehrten Platz in ihrem handverlesenen nationalen „KI-Team“. Bald darauf unterzeichnete iFlytek einen Fünfjahres-Kooperationsvertrag mit dem MIT-Labor für Informatik und künstliche Intelligenz (CSAIL), einem führenden KI-Labor. Die Übersetzungstechnologie des Unternehmens wird vom spanischen Fußballverein RCD Espanyol verwendet, und das Unternehmen unterzeichnete einen Exklusivvertrag über die Bereitstellung automatisierter Übersetzungen für die Olympischen Winterspiele 2022 in Peking. Mitte April wurde iFlytek an der Shenzhen Stock Exchange mit 10,8 Milliarden Dollar bewertet. In China sind die anderen Hauptkonkurrenten des Unternehmens im Sprachcomputerbereich hauptsächlich Plattformen wie Alibaba und Baidu.

iFlytek Input’s Datenschutzvereinbarung erlaubt es, persönliche Informationen für „nationale Sicherheit und nationale Verteidigungssicherheit“ zu sammeln und zu verwenden, ohne die Zustimmung der Benutzer. 
  • 2017: Die international renommierte Fachzeitschrift „MIT Technology Review“ nimmt iFlytek in ihre Rangliste der weltweit 50 innovativsten Unternehmen auf. Das chinesische KI-Unternehmen wurde zu Chinas Hightech-Unternehmen Nummer eins gekürt und nahm im globalen Vergleich Platz sechs ein.
  • 2017: Chinesischer Roboter von iFlytek besteht weltweit erstmals Zulassungsprüfung für Mediziner. Der KI-basierte maschinelle Arzthelfer mit der Fachkompetenz eines Allgemeinmediziners, der in Zusammenarbeit mit der renommierten Tsinghua-Universität entwickelt wurde, hat die schriftliche Prüfung der National Medical Licensing Examination mit guter Leistung bestanden hat. Das Ergebnis gehörte zu den besten vier Prüfungskandidaten.
  • Liu Qingfeng: „Jetzt wird die KI für die medizinische Behandlung eingesetzt, um elektronischen Krankenakten den letzten Schliff zu geben, medizinische Bilder zu lesen und Online-Diagnosen zu stellen. Der Arzt behandelt den Patienten und sein KI-Assistent hört zu und stellt gleichzeitig ein Rezept aus.“
  • 2020: Der KI-INDEX der Universität Duisburg-Essen betrachtet börsennotierten Unternehmen, welche Künstliche Intelligenz in Form von Produkten, Software oder Systemen entwerfen oder bereitstellen. Aktuell umfasst er die 15 führenden KI-Aktien, die nach ihrer Marktkapitalisierung gewichtet sind, darunter auch iFlytek
  • 2020: RedDot Award für den iFLYTEK Dual-Screen Translator. Eine der Besonderheiten des iFLYTEK Dual-Screen Translator sind seine zwei innovativen Bildschirme. Zwei Nutzer können in das Gerät sprechen und die Übersetzung wird dem jeweils anderen in Echtzeit als Niederschrift präsentiert. 

Produkte

Liu Qingfeng zur Zunkunft von KI-Asssistenten:
„Ich denke, wenn in Zukunft jeder einen KI-Assistenten hat, dann wird das wichtigste operative Modell wahrscheinlich die Sprache sein. Sobald wir in die KI-Ära eintreten, wird der Assistent jedes Benutzers von iFLYTEK zur Verfügung gestellt. Ihr Assistent wird Ihre Bedürfnisse noch besser verstehen als Sie selbst. Wenn Sie z.B. ein Paar Schuhe kaufen möchten, wird der KI-Assistent Ihnen sagen, welche Größe Ihnen passt und welche Schuhe Sie vorher getragen haben, und Ihnen dann eine Empfehlung entsprechend Ihrer einzigartigen Eigenschaften geben. Auf diese Weise haben Sie immer und überall einen Experten oder eine Sekretärin dabei. Wenn Sie einen Lehrer brauchen, kann der Assistent ein Lehrer sein; wenn Sie eine Sekretärin brauchen, ist er Ihre Sekretärin. Wir sammeln derzeit alle notwendigen Daten, Schritt für Schritt, und machen allmählich Fortschritte.“

  • Der Translator ist ein von iFlytek hergestelltes Sofort-Übersetzungsgerät. Das von einem Qualcomm Snapdragon-Chip angetriebenes Gerät funktioniert offline für die wichtigsten Weltsprachen.
  • Ein Tablett, das Geschäftsbesprechungen automatisch abschreibt
  • Einen Sprachassistenten, der in Autos im ganzen Land installiert wird.
  • Und auch im Bildungsbereich setzt die junge Hightech-Firma an. Sie hat ein individualisiertes Handbuch für Lernende erstellt. Durch Auswertung und Analyse von Unterrichts-Big-Data und Prüfungsergebnissen werden Übungsaufgaben zusammengestellt, die passgenau auf einzelne Schüler oder Studierende zugeschnitten sind. Mit diesen individualisierten Übungsaufgaben können gezielt Wissenslücken geschlossen und Lerneffizienz erhöht werden.
  • Neben Konsumgüter wird ein Großteil der Gewinne durch Dienstleistungen für die Regierung erzielt. Dazu gehören ein „intelligentes kriminalpolizeiliches Assistenzsystem“ sowie eine große Datenunterstützung für die Stadtregierung von Shanghai. iFlytek hat ein System patentiert, mit dem große Mengen von Audio- und Videodaten gesichtet werden können, um Dateien zu identifizieren, die kopiert oder zurückgelegt wurden – Teil einer Operation, die laut Patent „sehr wichtig für die Informationssicherheit und die Überwachung der öffentlichen Meinung“ ist.

Die Nutzung von persönlichen Daten ist in China weitreichender als bei uns in Europa und bietet gerade Unternehmen wir Flytec weitaus mehr Möglichkeiten zur Nutzung von datenbasierten Geschäftsmodellen. Die Nähe und direkte Zusammenarbeit mit der chinesischen Regierung lässt im Bereich der Datennutzung größere Freiheitsgrade vermuten.  

 

Köpfe

Hu Yu ist Geschäftsführer des chinesischen Tech-Unternehmens iFlytek, dessen Namen jeder Chinese kennt. Im Jahr 1978 geboren, beginnt der heutige iFlytek-Chef 1996 sein Studium des Signal- und Datenmanagements an der Universität für Wissenschaft und Technik in Heifei. Drei Jahre später gründet er das Unternehmen iFlytek mit 17 anderen Kommilitonen – unter ihnen ist auch der heutige Vorstandsvorsitzende des Tech-Unternehmens Liu Qingfeng.
Liu Qingfeng, Founder, Chairman and President
Dr. Liu Qingfeng, ein Absolvent der Universität für Wissenschaft und Technologie Chinas mit dem Schwerpunkt Signal- und Informationsverarbeitung, war schon in jungen Jahren ein sehr unternehmungslustiger Mensch. Im Jahr 1999 gründete er während seiner Doktorarbeit eine Firma namens iFLYTEK Co. Ltd. mit einer Gruppe von Kommilitonen. Als Vorstandsvorsitzender des Unternehmens übernahm Dr. Liu die Leitung des Unternehmens.
Der Vorsitzende des Unternehmens, Liu Qingfeng, führt den Erfolg auf drei Dinge zurück, die er richtig gemacht hat.
„Das erste war die richtige Entscheidung zur strategischen Ausrichtung; das zweite war unser Team von ehrgeizigen Menschen, die sich auf die Bereiche Rede und KI konzentrierten; das dritte war die Wahl einer neusten Technologien“, sagt er.