Amazon-Cloud hört zu, flüstert und erkennt Nacktbilder

  • Amazon-Cloud hört zu, flüstert und erkennt Nacktbilder


    Nach mehreren Monaten geschlossener Vorschau können nun alle Nutzer der Amazon-Cloud auf die Spracherkennung Lex zugreifen. Die Sprachsynthese Polly kann nun lippensynchron flüstern und die Bilderkennung filtert anstößige Inhalte.


    Ende vergangenen Jahres hat Amazon damit begonnen, jene KI-Techniken in seinen Cloud-Diensten anzubieten, die auch als Grundlage für den digitalen Assistenten Alexa dienen. Der wohl wichtigste Teil davon, die Spracherkennung Lex, ist nach einer geschlossenen Vorschauphase nun allgemein verfügbar.


    Lex bietet nun zusätzlich zu den bisherigen Möglichkeiten unter anderem auch eine Integration für die Dienste Slack und Twilio sowie eine Testkonsole für die Spracheingabe. Über die Mobile-Hub-Integration können die Fähigkeiten von Lex auch in weitere eigene Anwendungen eingebunden werden, um Konversationserfahrungen zu erzeugen, wie Amazon schreibt.


    Das Team der Amazon Web Services hat außerdem die für Text-to-Speech-Systeme genutzte Sprachsynthese Polly erweitert. So kann Polly nun mit Metadaten arbeiten, um die Sprachausgabe mit visuellen Daten zu kombinieren, wodurch lippensynchrone Ausgaben möglich sein sollen. Umsetzbar sind damit etwa animierte Bots, die mit ihren Nutzern sprechen können. Darüber hinaus verfügt Polly über einen weiteren Spracheffekt: das Flüstern. Amazon verspricht sich davon ausdrucksvollere Stimmen.


    Die Bilderkennung Rekognition ist ebenfalls ausgebaut worden und enthält nun eine Funktion, die Amazon als Image Moderation bezeichnet. Die auf Deep Learning basierende Anwendung erkennt auch "suggestive und explizite Bildinhalte", so dass derartige Fotos etwa schon beim Versuch diese hochzuladen erkannt und dann gefiltert werden. Genutzt werden hierzu einige verschiedene Kategorien wie etwa Menschen in Unterwäsche, Nacktheit oder auch sexuelle Aktivitäten.


    Quelle: golem.de