Trang chủ Thủ Thuật Có lẽ Alexa và Trợ lý Google sẽ không hiểu bạn tốt...

Có lẽ Alexa và Trợ lý Google sẽ không hiểu bạn tốt hơn

0
18
An Android phone with Google Assistant on the screen.

Có lẽ Alexa và Trợ lý Google sẽ không hiểu bạn tốt hơn

 

An Android phone with Google Assistant on the screen.
Lukmanazis / Shutterstock.com

Trợ lý giọng nói như Google Assistant và Alexa là một phần của cuộc sống hàng ngày. Chúng có trên điện thoại, máy tính xách tay, tường và điều khiển ngôi nhà thông minh. Nhưng chúng có thể khó sử dụng, đặc biệt là đối với bất kỳ ai nói tiếng Anh “không chuẩn”. Compies đang cố gắng khắc phục sự cố đó, nhưng nếu đó là một điều tồi tệ thì sao?

Bằng cách làm cho trợ lý giọng nói trong các ngôi nhà thông minh và trên điện thoại thông minh dễ sử dụng hơn, các công ty thực sự có thể đang giảm khả năng hoạt động của người dùng trong thế giới rộng lớn hơn. Có khoảng 1,35 tỷ người nói tiếng Anh trên toàn cầu, trong đó 400 triệu người là “người bản ngữ”.

Vì vậy, thật an toàn khi cho rằng khoảng 2/3 người nói tiếng Anh có một số mức độ trọng âm hoàn toàn vì nó không phải là ngôn ngữ mẹ đẻ của họ. Sau đó, với 400 triệu người nói tiếng Anh như ngôn ngữ thứ nhất, bạn có nhiều giọng quốc gia (Anh, Canada, Mỹ, Úc, v.v.). Ở mỗi quốc gia, bạn có phương ngữ khu vực, v.v.

Nếu các công ty chọn và hoàn thiện một phương ngữ duy nhất, chẳng hạn như tiếng Anh chuẩn Mỹ, thì sản phẩm của họ sẽ chỉ có thể sử dụng được bởi một phần nhỏ người nói tiếng Anh. Ngược lại, nếu họ đi quá xa, họ có thể cướp đi thứ có thể là một công cụ rất hữu ích để phát triển kỹ năng giao tiếp của họ.

Các công ty công nghệ đang cố gắng cải thiện mọi thứ như thế nào?

A woman talking to an Amazon Echo dot while frowning.
Tyler Nottley / Shutterstock.com

Trợ lý giọng nói đã và đang làm việc để hiểu rõ hơn các lệnh của người dùng miễn là chúng đã tồn tại. Microsoft, Apple, Google và Amazon là một trong những tên tuổi lớn đã bơm rất nhiều tài nguyên vào trợ lý giọng nói tương ứng của họ và muốn làm cho chúng dễ tiếp cận và không gây khó chịu cho càng nhiều người càng tốt.

Điều này đã liên quan đến việc thuê những người có giọng đặc biệt để ghi lại hàng trăm lệnh thoại và cuộc hội thoại, sau đó có thể được sử dụng để dạy phương ngữ AI. Trong một tháng gầy gò của mình, tôi quyết định học giọng miền Bắc gợi cảm của mình và dành hàng giờ ghi âm hàng trăm từ và cụm từ có vẻ ngẫu nhiên cho một công ty tên là Appen.

Công ty đó sau đó đã lấy các bản ghi âm của tôi và gửi chúng đến Amazon, Google, Microsoft hoặc bất kỳ ai khác đang trả tiền cho chúng. Các đoạn mã giọng nói sau đó được sử dụng về mặt lý thuyết để cải thiện bất kỳ AI mà công ty mua chúng đang phát triển.

Một số trợ lý giọng nói thậm chí có thể được đào tạo để hiểu rõ hơn giọng nói chính xác của người sử dụng nó. Không giống như việc chờ đợi các công nghệ lớn cập nhật trò chơi của họ, điều này tạo ra kết quả ngay lập tức và có thể giúp độ chính xác của trợ lý giọng nói của bạn đáng kể. Nó cũng cho phép nhiều người dùng truy cập hồ sơ nhà thông minh của họ mà không cần phải chuyển đổi thủ công.

Vì vậy, tại sao điều này có thể là một điều xấu?

An Amazon Echo on a living room coffee table.
Juan Ci / Shutterstock.com

Tôi có thể tránh xa với câu nói: “Alexer, báo thức lúc tám giờ đồng hồ sẽ vang lên,” nhưng việc cố gắng yêu cầu các bài hát mới là lúc cuộc đấu tranh thực sự bắt đầu. Mất khoảng ba tháng giao tiếp với Amazon Music và vài nghìn từ ngữ tục tĩu, nhưng bây giờ tôi có thể nói “play Happy Hour by The Housemartins” rõ ràng như một người đọc tin tức của BBC những năm 1980. Vẫn có những dịp tôi yêu cầu Paul Weller và bằng cách nào đó kết thúc với Ella Fitzgerald, nhưng luôn có chỗ để cải thiện.

Lớp lót bạc đi kèm với những khó khăn về trọng âm là thực tế tiếng Anh của tôi đã được cải thiện. Bây giờ tôi có thể giao tiếp rõ ràng hơn bao giờ hết. Điều này rất hữu ích vì công nghệ có thể cải thiện đến mức AI trên điện thoại thông minh của tôi có thể hiểu tôi — nhưng điều đó sẽ không giúp ích gì nhiều cho tôi khi tôi đang sử dụng điện thoại để nói chuyện với một người khác.

Một lợi ích khác là tôi đã không hoàn toàn bỏ qua giọng của mình trong quá trình này. Thay vào đó, nếu tôi chọn bỏ qua các bài học elocution, tôi có thể đang đọc lung tung các câu trong cách phát âm đã nhận được. Danh tính là quan trọng; điểm nhấn là một phần quan trọng trong văn hóa và nền tảng của một người nào đó.

Vương quốc Anh, chẳng hạn, cứ cách vài dặm lại có một giọng khác biệt. Có một bản đồ đã xuất hiện trên internet trong một vài năm trông có vẻ rộng nhưng vẫn hầu như không bị trầy xước bề mặt. Một phần nhỏ của Đông Bắc được dán nhãn là có giọng “Teesside”, nhưng người bản xứ của mỗi thị trấn trong khu vực đó (Middlesbrough, Hartlepool, Stockton và Billingham) đều nói khác nhau.

Bây giờ hãy tưởng tượng các biến thể trong một hạt có kích thước bằng Yorkshire. Mọi người cũng có xu hướng xác định họ đến từ đâu và bảo tồn rất nhiều văn hóa của họ. Trọng âm là một phần lớn trong đó; không phải ai cũng muốn nghe như Hugh Grant. Chúng ta có thể đã hư hỏng trong những năm gần đây, vì nhiều người hiện đang vui vẻ ngồi lại và chờ đợi công nghệ bù đắp cho những thiếu sót của họ — và trong rất nhiều trường hợp, nó sẽ làm được điều đó. Nhưng đôi khi, việc gặp gỡ công nghệ ở giữa nhanh hơn và tốt hơn về lâu dài.


Trợ lý giọng nói cần được cung cấp cho càng nhiều người càng tốt. Nếu bạn phải nói bằng cách phát âm hoàn hảo trước khi Siri cung cấp cho bạn thời gian trong ngày, thì một trong những thành công quan trọng nhất của Apple sẽ trở nên vô ích đối với hơn 99,9% người nói tiếng Anh.

Ngay cả những thứ như giọng Mỹ chuẩn cũng sẽ loại trừ phần lớn người dùng ở Hoa Kỳ, đừng bận tâm trên toàn thế giới. Do đó, rõ ràng là tại sao các công ty đang nỗ lực rất nhiều vào việc dạy phần mềm của họ hiểu nhiều phương ngữ nhất có thể. Và vì vậy họ nên làm như vậy. Nhưng họ chỉ nên đi xa.

Sẽ tốt hơn nếu Apple, Google, v.v. tránh áp dụng tâm lý cầu toàn và thay vào đó chỉ nhắm đến một tiêu chuẩn cho phép khả năng tiếp cận nhưng vẫn yêu cầu một chút cẩn thận từ phía người dùng. Trên một ghi chú cá nhân, việc Alexa không muốn nghe bất cứ thứ gì ngoài lời nói rõ ràng đã buộc tôi phải suy nghĩ về cách tôi phát âm mọi thứ.

Không nghi ngờ gì nữa, bài phát biểu của tôi rõ ràng hơn so với trước đây khi tôi phải tiếp xúc với trợ lý giọng nói nhiều lần trong ngày. Đó không phải là điều tôi bắt đầu làm; đó là một tác dụng phụ không mong muốn và rất có lợi — và nếu nó hiệu quả với tôi, nó cũng có thể hiệu quả với những người khác.

Review Geek Is Looking For Freelance Technology Writers

Đánh giá Geek đang tìm kiếm nhà văn công nghệ tự do

Hulu Price Hike: Which Plans Are Affected?

Hulu tăng giá: Những kế hoạch nào bị ảnh hưởng?

Motorola’s $160 Moto G Pure Smartphone Redefines the Word “Budget”

Điện thoại thông minh Moto G Pure trị giá 160 đô la của Motorola định nghĩa lại từ “Ngân sách”

Rid Your Oculus Quest 2 of Facebook with This Free Tool

Thoát khỏi nhiệm vụ Oculus 2 của bạn trên Facebook với Công cụ miễn phí này

Save on the iPad Air, Razer Blade Stealth 13, and More During Amazon’s Sale

Tiết kiệm khi mua iPad Air, Razer Blade Stealth 13 và hơn thế nữa trong đợt giảm giá của Amazon

Arlo Forces Users To Pay For Basic Device Tech Support

Arlo buộc người dùng phải trả tiền để được hỗ trợ kỹ thuật thiết bị cơ bản

Ray-Ban Stories Review: Get These Off My Face

Đánh giá về câu chuyện của Ray-Ban: Bỏ những thứ này ra khỏi khuôn mặt của tôi

Dịch từ: https://www.reviewgeek.com/99008/voice-assistants-wil-get-better-at-understanding-you-and-that-might-be-a-mistake/

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây