Огляд Microsoft Azure: Сучасна обробка голосу

Microsoft Azure Speech to Text - одна з найдосконаліших платформ розпізнавання голосу. Як частина асортименту продуктів Microsoft Cognitive Speech Services, він використовує алгоритми глибокого навчання для подолання низької якості звуку і може адаптуватися до різних стилів мовлення для точної транскрипції звуку. У цьому огляді Microsoft Azure Speech to Text ми уважно розглянемо цю послугу.

Варто зазначити, що Microsoft Azure Speech to Text - це не традиційна частина зручного програмного забезпечення для диктування. Натомість це орієнтована на розробників платформа, призначена для допомоги підприємствам у створенні, тестуванні та управлінні власними продуктами. Якщо ви просто хочете переписати партію аудіофайлів, кращим варіантом можуть бути альтернативні програми перетворення мови в текст. Подивіться наш найкращий посібник із програмного забезпечення для перетворення мови в текст, щоб отримати найкращі альтернативи.

Microsoft Azure Speech to Text: плани та ціни

Використовуючи Microsoft Azure Speech to Text, ви можете безкоштовно переписати до п’яти годин аудіо та створити одну користувацьку модель голосу на місяць. Однак за безкоштовним тарифом одночасно доступний лише один паралельний аудіозапит, що означає, що ця опція неможлива для більшості підприємств.

Виставлення рахунків за мовну послугу Azure ділиться на кроки в одну секунду.

Якщо ви хочете переписати більше одного мовного кліпу одночасно, вам доведеться перейти на стандартну систему ціноутворення Azure. Це коштує 1 долар США за годину звуку та підтримує до 20 одночасних запитів. Якщо вам потрібно використовувати власну аудіомодель або переписати багатоканальні звукові файли, стягуються додаткові збори. Ці додаткові послуги коштують $ 1,40 і $ 2,10 за годину звуку відповідно.

Незважаючи на те, що Microsoft перелічує ціни у форматі "за звукову годину", як це є галузевим стандартом, оплата фактично ділиться на кроки в одну секунду, тому ви не будете платити за більший час обробки, ніж потрібно.

Microsoft Azure Мова в текст: Особливості

Ключовою функцією Azure Speech to Text є доступ, який вона надає до потужної системи обробки природних мов Microsoft. За останні кілька років мовний інтелект від Microsoft досягнув кількох важливих етапів. Це означає, що тепер він може виконувати завдання, які раніше були неможливими для служби розпізнавання мови, наприклад, точну транскрипцію перехресних розмов під час невеликих групових бесід.

Служба Microsoft Azure Speech to Text може інтегруватися з Office 365 для оптимальної точності.

Azure працює з десятками мов та діалектів, і його можна навчити, використовуючи власні моделі розпізнавання мови, щоб краще адаптуватися до стилю мовлення користувача, фонового шуму та лексики. Якщо ваша організація вже прихильна до екосистеми продуктів Microsoft, ви можете використовувати дані Office 365 для кращого покращення точності розпізнавання мовлення для конкретних термінів організації. І, що важливо, це можна зробити, не ставлячи під загрозу безпеку ваших даних, оскільки функцію «Мовлення в текст» можна запускати локально.

Microsoft Azure Speech to Text: Налаштування

Microsoft Azure розроблений для розробників, а не для споживачів. Це означає, що його налаштування є залученою та дещо складною процедурою, яку найкраще залишити комусь із значним технічним ноу-хау.

Налаштування Azure не зовсім просто, якщо у вас немає досвіду кодування.

Найшвидший спосіб налаштування Azure - це використання Azure Speech SDK у мові програмування, як Java або C ++. Для цього вам потрібно буде зареєструватися для безкоштовного облікового запису Azure і створити порожній проект у своєму середовищі розробки. Потім вам потрібно буде скористатися Microsoft Visual Studio і написати коротку програму для ініціалізації об’єкта SpeechRecognizer від Microsoft.

Microsoft Azure Мова в текст: Інтерфейс

Як і інші платформи масової транскрипції, Microsoft Azure Speech to Text призначений для запуску як інтерфейсу програмування програм (API), додавання до програм Office 365 або інтеграції в нові платформи та служби. Через це немає єдиного інтерфейсу Azure Speech to Text. Те, що побачить кінцевий користувач, залежить від того, як було інтегровано Azure Speech to Text.

Інтернет-портал Azure інтуїтивно зрозумілий та простий у використанні.

Тим часом розробник, який керує Azure, зробить це через Інтернет-портал Azure від Microsoft, який відчуває себе сучасно і легко орієнтується. Знайдіть сторінку ресурсу мовних служб лише за кілька хвилин, і як тільки екземпляр буде доданий до вашого облікового запису, сповіщення про спостереження та використання можна буде переглянути в одному вікні.

Microsoft Azure Speech to Text: Performance

В рамках нашого огляду Microsoft Azure Speech to Text нам було цікаво побачити, як ця платформа вирішила проблему обробки необроблених голосових записів, тому, як тільки наш акаунт Azure був готовий до роботи, ми завантажили серію кліпів із різним рівнем фонового шуму . Навколо Azure добре справився з обробкою наших зразків, оскільки під час оцінки ми побачили не більше ніж кілька помилок.

Увімкнення власної моделі мовлення Azure покращило нашу точність транскрипції.

Azure справді трохи боровся при обробці незвичних або спеціальних фраз, таких як назви спортивних команд та наукові терміни, але це було швидко вирішено, увімкнувши спеціальну опцію виведення моделі. Щойно ми активували цю опцію, Azure зміг адаптуватися до унікальної лексики та стилю мовлення, який ми використовували.

Microsoft Azure Speech to Text: Підтримка

Щоб дізнатись, як взаємодіяти з Azure Speech Services SDK за допомогою різних мов програмування та інтегрувати функції Azure Speech to Text у власну платформу, вам точно знадобиться допомога. На щастя, Microsoft створила повний каталог навчальних матеріалів для платформи Azure, в якому ви знайдете приклади коду та корисні поради.

Навчальний розділ веб-сайту Azure містить багато корисних ресурсів.

Крім того, усі клієнти Azure отримують безкоштовну підтримку виставлення рахунків та управління передплатою, до якої можна отримати доступ через систему квитків. Більш глибоку підтримку можна додати до свого рахунку за періодичну плату, починаючи з 29 доларів на місяць.

Microsoft Azure Speech to Text: Остаточний вердикт

Платформа Azure Speech to Text використовує передові технології для надання майже ідеальної послуги транскрипції. Він найбільш підходить для підприємств, які вже інвестували в екосистему Microsoft Office 365, оскільки власні моделі голосу та словникового запасу можна безпечно генерувати з вашого існуючого архіву документів. Деякі малі підприємства можуть боротися з Azure, оскільки його правильна настройка вимагає уваги кваліфікованого хмарного розробника Microsoft.

Змагання

Amazon Transcribe, Google Cloud Speech-to-Text та Watson Speech to Text є прямими конкурентами Microsoft Azure. Ці три платформи також здатні точно виконувати об'ємні пакетні транскрипції. Google Cloud є єдиним близьким конкурентом, здатним працювати з більшою кількістю мов, ніж Azure, але він дорожчий, із початковою ставкою лише 0,006 доларів за 15 секунд, порівняно з 0,017 доларів США за хвилину (0,00425 доларів за 15 секунд).

Щоб знайти інші альтернативи Microsoft Azure Speech to Text, перегляньте наш найкращий посібник із програмного забезпечення для перетворення мови в текст.

Цікаві статті...