Đại học Rochester phát triển ứng dụng giúp điện thoại nhận ra cảm xúc qua giọng nói của con người

Trong tương lai, bạn chỉ cần nói là điện thoại sẽ biết bạn đang vui hay buồn

Trong cuộc sống hàng ngày, khi bạn tiếp xúc hay nói chuyện với ai đó nếu tinh ý một chút bạn sẽ nhận ra cảm xúc, thái độ, tâm trạng của người đối diện. Cảm nhận đó nói chung là khá chính xác và nó được hình thành từ khả năng quan sát, nhìn nhận của bạn trong quá trình phát triển cũng như giao tiếp với xã hội. Liệu khả năng này có thể xuất hiện với một thiết bị điện tử thông minh trong thời đại của chúng ta? Câu trả lời vẫn nằm trong hi vọng của những nhà nghiên cứu, các kĩ sư, chuyên gia đang làm việc với một dải rộng kiến thức từ tâm lý học, xã hội học và lập trình. Tuy nhiên, giấc mơ ấy đang tiến gần tới hiện thực hơn bao giờ hết khi tại một Hội nghị của IEEE về công nghệ nhận dang tiếng nói được tổ chức cách đây ít ngày, các nhà khoa học tại Đại học Rochester (HOA KY) vừa công bố họ đã phát triển thành công một thuật toán giúp điện thoại có thể nhận ra cảm xúc người dùng qua phân thích người nói của họ. Điểm nổi bật nhất của thuật toán này là độ chính xác trong phán đoán tỏ ra vượt trội so những phương pháp được áp dụng từ trước tới nay và vì thế nhóm nghiên cứu hi vọng họ sẽ sớm đưa nó có mặt thông qua các ứng dụng trong tương lai gần.

Kết hợp với chuyên gia tâm lý và một thực tập sinh nghiên cứu tại Microsoft, giáo sư về khoa học máy tính và điện tử Heinzelman của Đại học Rochester đã tiến hành tìm hiểu sự liên quan giữa cảm xúc của con người và cách thức mà họ biểu hiện những cảm xúc đó khi nói. Nhóm nghiên cứu đã tập trung xem xét 12 đặc trưng khác nhau của tiếng nói, ví dụ như cao độ và âm lượng. Các thông số này được đo đạc từ nhiều tình nguyện viên với các cảm xúc khác nhau thông qua những đoạn ghi âm ngắn. Bằng cách phân tích cảm xúc tương ứng với chỉ số vật lý của các đặc trưng, nhóm nghiên cứu có thể chia ra 6 dạng cảm xúc khác nhau. Trên cơ sở đó họ xây dựng thông tin đầu vào cho từng trường hợp cho ứng dụng điện thoại. Với dữ liệu có sẵn, phần mềm được viết dựa trên thuật toán được xây dựng có thể chỉ ra thông tin mới, người nói đang vui, buồn, lo sợ, chán nản, nóng giận hay bình thường.

Kết quả mà điện thoại đưa ra cho thấy các phán đoán có độ chính xác lên tới 81%. Đây là một con số rất đáng nghi nhận so với tỷ lệ chính xác cao nhất là 55% (gần như 5 ăn 5 thua) so với các nghiên cứu trước đó. Mặc dù vậy, kỹ thuật mới vẫn chưa giải quyết được sự sai lệch trong phán đoán nếu thay các tình nguyện viên bằng những người mới khi mà độ chính xác trong trường hợp này chỉ ở mức 30%. Các nhà khoa học hi vọng trong thời gian tới họ sẽ tìm được cách khắc phục nhược điểm này và phát triển để ứng dụng có thể làm việc trong điều kiện cuộc sống thường ngày khi mà âm thu được đến nhiều nhóm người với độ tuổi, giới tính khác nhau. Họ cũng có ý định thêm tính năng điều khiển màu sắc màn hình hay để điện thoại tự động chơi các bản nhạc phù hợp với cảm xúc của người nghe.

Nguồn TinhTe