Công nghệ nhận diện giọng nói Trint: Không chỉ ghi chép lời thoại mà còn phân biệt được ai đang nói

Công nghệ nhận diện giọng nói Trint: Không chỉ ghi chép lời thoại mà còn phân biệt được ai đang nói

Với khả năng nhận diện được người nói, Trint mở ra kỷ nguyên mới cho loại hình truyền thông không chữ.

Nếu Google Talk và Siri chỉ dừng ở việc ghi chép hội thoại thông thường thì Trint còn có thể phân biệt được ai là người cất giọng. Chính CEO của Trint, Jeff Kofman đã phải thừa nhận việc dành hàng nghìn giờ ngồi chép lại các bài nói chuyện, hội thảo, phỏng vấn,… trong suốt hơn 3 thập kỷ làm báo đã thôi thúc anh thiết kế công cụ tự động hóa này.

Công nghệ nhận diện giọng nói Trint: Không chỉ ghi chép lời thoại mà còn phân biệt được ai đang nói

Công nghệ chuyển giọng nói thành văn bản được rất nhiều người theo đuổi nhưng chưa công cụ nào đạt tới độ hoàn hảo. Các hãng truyền thông liên tục sản xuất nội dung video nhưng chưa được tối ưu hóa để công cụ tìm kiếm có thể tìm ra. Bởi vậy, Trint có thể mở ra kỷ nguyên mới cho các loại hình truyền thông không chữ như video hay podcast.

Nếu không có điều kiện theo dõi buổi hội thảo, phỏng vấn kéo dài hàng tiếng đồng hồ, khán giả có thể đọc lướt transcript của video hay podcast. Còn các phóng viên cũng tích kiệm vô khối thời gian và rảnh tay khi phải ghi chép các buổi nói chuyện.

Công nghệ nhận diện giọng nói Trint: Không chỉ ghi chép lời thoại mà còn phân biệt được ai đang nói

Trint có khả năng xử lý các đoạn text ngay trên màn hình soạn thảo trong trình duyệt, đồng thời gắn luôn phần chữ đang viết với đoạn audio đang nhắc đến trong file ghi âm. Độ chính xác chưa được 100% nhưng ứng dụng vẫn cung cấp được một đoạn text đầy đủ, gãy gọn để có thể tìm và chỉnh sửa lại. Không những thế, Trint còn có mức giá hấp dẫn hơn nhiều so với 3Play hay Casting Words, chỉ 15 USD/giờ.

Mai Hoàng

Bài viết liên quan

Nên xem

Cùng chủ đề

Bình luận