Огляд програмного забезпечення для транскрипції Sonix.ai

Кожен інструмент, який транскрибує, націлений на конкретну нішу, і Sonix обрав ті, які записують зустрічі чи презентації, а потім потребують друкованої версії для пошуку або розповсюдження.

Тому це могло б бути настільки ж корисним для студента, як і для керівника, забезпечуючи транскрипції, які можна легко проіндексувати для подальшого використання.

Але для успішного виконання цих завдань програмне забезпечення має бути точним та доступним.
Чи є Sonix.ai таким інструментом, і чи може онлайн-сервіс конкурувати з встановленим додатком?

  • Хочете спробувати Sonix.ai? Перевірте веб-сайт тут

Плани та ціноутворення

Як і для багатьох служб транскрипції, модель вартості Sonix базується на часі. Зокрема, тривалість будь-якого запису, який ви завантажуєте на сервіс для обробки, і вартість цього ресурсу складає 10 доларів на годину, якщо ви використовуєте його стандартну послугу оплати на час.

Вартість години може бути знижена до 5 доларів, якщо ви підпишетесь на послугу підписки Premium за 22 долари на місяць для кожного користувача. Крім того, діють знижки за обсяги для тих компаній, яким потрібно більше 100 годин на місяць для переписування.

Стандартний план має найосновніші функції, а Premium додає такі, як багатокористувацький доступ та спільний доступ до команди. І Enterprise має все, що пропонує Premium, з великою кількістю додаткових можливостей адміністрування та вдосконаленою моделлю підтримки.

По мірі того, як послуги транскрипції йдуть, Sonix є однією з найдорожчих, і, звичайно, не те, що більшість студентів або домашніх користувачів могли б собі дозволити.

Дизайн

Сайт my.sonix.ai використовує винятково чистий дизайн, а створення облікового запису безкоштовне.

На момент написання статті це виключно веб-сервіс, і Sonix не має мобільного додатку для збору та надсилання на обробку аудіозаписів.

Однак, оскільки ми розглянемо це пізно, існують прості способи вирішити цю проблему, які дещо вирішують відсутність мобільного додатка.

Початковою точкою для будь-якого завдання транскрибування є інформаційна панель Sonix.ai, де ви можете побачити аудіо, яке вже було транскрибовано, і додати нові для обробки.

Оскільки ця система була розроблена для кількох користувачів, вона включає систему віртуальних папок для організації транскрипцій будь-яким способом, який вважається придатним.

Натискання кнопки "завантажити" переводить користувача на сторінку, де в систему можна потрапити кілька файлів, і якщо обліковий запис має достатньо кредитів, їх можна обробити.

Підтримуються всі стандартні формати аудіофайлів, включаючи wav, mp3, mp4a, aiff, acc, ogg та wma, а також ви можете завантажити деякі структури упаковки відео. Максимальний розмір файлу - 4 Гб, тому перед завантаженням великого відеофайлу з роздільною здатністю 4K ми рекомендуємо скористатися іншим інструментом для розділення аудіо, щоб зробити його швидшим.

Хороший спосіб пришвидшити завантаження - скористатися хмарним сховищем, таким як Google Drive, One Drive, Box або Dropbox, і пов’язати його безпосередньо з обліковим записом. Ви також можете надіслати систему електронною поштою, використовуючи Gmail, як засіб для створення більш елегантного робочого процесу, ніж скидання файлів на веб-сторінку.

Ця автоматизація забезпечується через Zapier, що дозволяє набагато ширше інтегруватись, якщо бізнес, що використовує його, інвестував у цю технологію для підключення своїх бізнес-процесів.

Ще одним приємним штрихом є те, що разом із аудіо- чи відеофайлом ви можете включити існуючу транскрипцію як засіб для швидшого завершення процесу та підвищення точності.

Ще одним приємним штрихом є те, що разом із аудіо- чи відеофайлом ви можете включити існуючу транскрипцію як засіб для швидшого завершення процесу та підвищення точності.

Через природу хмарної обробки судити про те, наскільки швидкою або повільною може бути обробка, неможливо, але Sonix.ai на наш досвід порівняно швидкий. Зазвичай транскрипція займає від 10% до 20% часу, поки триває запис. Тому завершення 10-хвилинного запису зазвичай займає менше 2 хвилин.

Вам не потрібно стежити за обробкою, оскільки система надішле вам повідомлення електронною поштою, коли робота буде виконана, разом із посиланням на нову транскрипцію.

Після обробки файлу ви можете відкрити його в межах сторінки та редагувати, щоб переглянути результати, а також експортувати текст у широкому діапазоні корисних форматів, включаючи ті, які деякі програми визначають як субтитри.

Кількість мов та діалектів, що підтримуються системою, становить 36, і це включає безліч англомовних, французьких, кантонських, мандаринських, португальських та іспаномовних країн, поряд із усіма загальними західноєвропейськими та східноєвропейськими мовами, а також деякими азіатськими та арабськими.

Записи

Поряд з роботою, яка зайнялася ШІ, необхідною для інтерпретації шумів, які видають люди, ймовірно, сторінка «Записи» представляє тут значні зусилля щодо кодування.

Тут як аудіо, так і пов'язану з ним стенограму можна порівняти та покращити вручну з деталями змін динаміка та виправлення помилкових інтерпретацій.

Для всіх, хто працює над стенограмою для полірування тексту, на цій сторінці вказано місце розташування вугільної поверхні. Має сенс, що до цієї частини докладено певних зусиль, оскільки вона дуже проста у використанні та дотриманні.

Намагаючись спрямувати користувача на те, де можуть бути проблеми, Sonix.ai розфарбує вміст, щоб виділити ті розділи, які є менш впевненими в собі. Ця функція може бути корисною, хоча Sonix.ai може робити помилки навіть у тих частинах, де, на його думку, транскрипція має статус "Дуже впевнено".

Найкращими аспектами цієї сторінки є те, як синхронізуються відтворення аудіо та текст, так що розміщення курсору в тексті переміщує позицію відтворення до того самого розділу.

Поряд із простим редагуванням також можна виділяти розділи у різних стилях та робити примітки, що йдуть поряд із транскрипцією.

Ви також можете налаштувати часовий код, особливо корисно, якщо запис починається з тривалої паузи або небажаної преамбули.

Точність

Sonix описує Sonix.ai як «найкраще програмне забезпечення для автоматизованої транскрипції, що працює на основі найсучаснішого ШІ».

Враховуючи наше тестування, ми б описали цей продукт як такий, що сильно залежить від якості запису та багатьох інших факторів, які неможливо легко контролювати.

При обробці наших класичних історичних записів мови з деякими ораторами це було дуже важко, навіть якщо вони нам звучали зрозуміло.

Ці результати суттєво контрастували з деякими більш одночасними записами, де точність була прийнятною, але навряд чи зоряною.

Ми дійшли висновку, що підхід, застосований Sonix, робить кілька припущень, які можуть працювати чи ні, залежно від динаміка та якості запису.

Захоплюючим було те, що служба буде кольорово кодувати свою транскрипцію, виходячи з того, наскільки впевнена у сказаному, і цей самоаналіз дуже показовий.

За деяких обставин він правильно визначить, що розділ може бути підозрілим, але в інших частинах він впевнений, що розділ, який він переписав, абсолютно неправильний.

Кілька поширених питань, здається, створюють криволінійний кут, і одним з них є люди, які не говорять граматично досконалої прози. Намагаючись зробити свою промову більш прямою, вони вилучили деякі слова зі своїх речень, створивши більш драматичний стиль. Коли їх транскрибує Sonix, видається рішучим додати ці слова назад, щоб вони відповідали його внутрішній граматичній моделі, а не тому, що насправді було сказано.

Транскрипція краще читається як документ, але вона не є справді репрезентативною для сказаного.

Sonix, безумовно, кращий, коли якість запису та чіткість динаміка високі, що ми довели з невеликим кліпом Стівена Фрая, який читає Гаррі Поттера. Але не завжди можна мати такий контроль над якістю звуку, і він все одно допускав помилки під час цього тесту.

Ще одна проблема - це офіційні назви та технічні слова або скорочення. Їх можна вирішити, додавши їх до користувацького словника, але для цього потрібна робота, щоб система могла краще реалізовуватись, коли використовуються імена чи абревіатури.

Для тих, кому потрібне ідеальне слово транскрипції, Sonix має вибір відповідних професійних транскрипторів, які можуть обробляти записи та вирішувати ці проблеми, але це дещо перешкоджає меті обробленої транскрипції.

Безпека

Фокусом безпеки Sonix.ai є сервери, на яких обробляється аудіо та зберігаються транскрипції.

Весь трафік шифрується за допомогою TLS (Transport Layer Security), і як тільки файли знаходяться на сервері, який захищений декількома шарами брандмауера, захист від вторгнень і всі дані огороджуються шифруванням на стороні сервера AES-256. Компанія обіцяє, що співробітники не матимуть доступу до записів чи транскрипцій, якщо їм не буде надано явного дозволу на це.

Найважливіша проблема такого підходу полягає в тому, що простий логін та пароль можуть обійти все це. Sonix.ai не має двофакторної автентифікації і не має легкодоступного журналу, хто і коли отримує доступ до файлів.

З точки зору безпеки, це цілком можна розглядати як надмірну залежність від цілісності тих, хто використовує систему, щоб не передавати записи іншим особам, що не належать до бізнесу, або зберігати потенційно конфіденційні файли, коли вони залишають компанію.

Коротше кажучи, безпека повинна бути кращою, а відстеження або діяльність користувачів надати більший пріоритет.

Остаточний вердикт

Враховуючи відносно високу вартість, ми очікували, що Sonix буде працювати краще, ніж це було.

Можливо, нам не пощастило з вибором речей, які потрібно перекодувати, але все-таки, здається, це робить непомірну кількість помилок.

Позитивною стороною цього рівняння є те, що він швидкий, і це надзвичайно проста у використанні система, хоча ми рекомендуємо запустити кілька прикладів записів через це рішення перед тим, як здійснити передплату.

Найбільша проблема Sonix - це висока вартість, і навіть якщо це правильний інструмент для вашої конкретної вимоги, є дешеві засоби для перетворення звуку в текст деінде.

Цікаві статті...