Thông báo

Collapse
No announcement yet.

Nhận dạng tiếng nói

Collapse
X
 
  • Lọc
  • Giờ
  • Show
Clear All
new posts

  • Nhận dạng tiếng nói

    Chào các bạn! hiện nay mình đang làm đề tài "Hệ nhúng nhận dạng tiếng việt" nhưng chỉ dừng lại ở từ tiếng việt rời rạc. Mình phải làm mạch phần cứng,theo minh tìm hiểu thì có nhiều con vi điều khiển có hỗ trợ DSP như dsPIC,ARM, và DSP TMS320C6713 của TI. Hiện giờ mình không biết lựa chọn thế nào. Ai có kinh nghiệm trong lĩnh vực này chỉ giúp mình với.

  • #2
    Nhận dạng tiếng nói là một trong những đề tài thuộc dạng chua chát.Cái này mình cũng đã làm nhưng vì lí do cá nhân nên phải dừng lại.Với các bộ VXL dsPIC,ARM hay TI thì điều cần thiết là các bộ VXL này phải nhanh,mạnh..Lúc trước là tôi làm trên Kit TMS320C6711 của TI,tôi không làm về dsPIC hay ARM nên không biết chúng hỗ trợ như thế nào,chỉ có điều nếu bạn làm của TI thì tôi nghĩ sẽ có nhiều ví dụ hơn cho bạn tham khảo vì TI phát triển bộ Kit Xử lí tín hiệu khá lâu so với các họ khác,nhưng hình như là TI không có nhiều ở VN và người làm về lĩnh vực này cũng rất ít.
    Một phương pháp mới của nhận dạng là dùng pp notron,đặc điểm của pp này là khả năng tự học của nó,tuy nhiên nó là một khối phép toán đồ sộ và cần phải xử lí thật thật nhanh với những ứng dụng real time này.Nếu như bạn không có một bộ VXL đáp ứng tốt yêu cầu thì các pp cổ điển như HMM cũng vẫn nhận dạng khá tốt,cái chính là phải xử lí nhiễu và pp phân tích đặc trưng tốt...
    Một vài ý kiến chia sẻ cùng bạn!
    Hôm nay phải hơn hôm qua và thua ngày mai!

    Comment


    • #3
      Nguyên văn bởi antebk Xem bài viết
      Chào các bạn! hiện nay mình đang làm đề tài "Hệ nhúng nhận dạng tiếng việt" nhưng chỉ dừng lại ở từ tiếng việt rời rạc. Mình phải làm mạch phần cứng,theo minh tìm hiểu thì có nhiều con vi điều khiển có hỗ trợ DSP như dsPIC,ARM, và DSP TMS320C6713 của TI. Hiện giờ mình không biết lựa chọn thế nào. Ai có kinh nghiệm trong lĩnh vực này chỉ giúp mình với.
      Bạn có thể nói rõ hơn về đề tài của bạn không?
      Cụ thể là ứng dụng như thế nào?. Ví dụ: điều khiển bắng giọng nói..., tách tiếng nói...

      Comment


      • #4
        Cám ơn các bạn đã cho ý kiến. Thực ra bộ kit TMS320C6711 thì ở chỗ mình cũng được trang bị. Mình làm đề tài tốt nghiệp về cái này. Năm trước đã có người phát triển trên kit đó. Do đó năm nay mình phải làm bằng cái khác.

        Comment


        • #5
          Bạn nào có biết tài liệu nào hay về nhận dạng tiếng nói sử dụng phương pháp notron xin giới thiệu dùm.Nếu có link thì càng tốt.Xin cám ơn nhiều

          Comment


          • #6
            Nguyên văn bởi antebk Xem bài viết
            Cám ơn các bạn đã cho ý kiến. Thực ra bộ kit TMS320C6711 thì ở chỗ mình cũng được trang bị. Mình làm đề tài tốt nghiệp về cái này. Năm trước đã có người phát triển trên kit đó. Do đó năm nay mình phải làm bằng cái khác.
            Quan trọng là mình phát triển được gì trên kit đó chứ đâu phải là do năm ngoái có ngươi làm rồi mà năm nay ko làm nữa.

            Comment


            • #7
              đã sang bài thứ 6 rồi mà vẫn chưa có pác nào đứng ra nhận diễn giải cho anh em.
              Các pác ơi, cho đám hậu bối này học hỏi cùng nữa.
              Với phương châm CŨ NGƯỜI MỚI TA nên bản thân nano càng mong muốn học hỏi kiến thức.

              Vui.

              Comment


              • #8
                cái này cũng hay tôi cũng muốn biết làm sao người ta biết rất chính xác giọng nói trên băng ghi âm là của binladen. ( dựa vào việc so sánh với bản gốc về 4 đặc trưng của giọng nói ah: cường độ, cao độ, trường độ, tần số??)

                vậy là cần có bộ tách, so sánh.??
                chỉ llac bang tel

                Comment


                • #9
                  Tách Tiếng Nói Khỏi Nền Nhiễu.
                  Mình đang Nghiên Cứu Nó Bằng Dsp Của Ti
                  Ai Có Kinh Nghiệm Ko
                  |

                  Comment


                  • #10
                    Nguyên văn bởi DINH_HUNG Xem bài viết
                    Tách Tiếng Nói Khỏi Nền Nhiễu.
                    Mình đang Nghiên Cứu Nó Bằng Dsp Của Ti
                    Ai Có Kinh Nghiệm Ko
                    Bạn có cao kiến gì không?
                    Khoan hãy nói đến nhận dạng thực trên các Kit,có bạn nào đã phân tích và nhận dạng sóng qua Matlap chưa?

                    Theo mình Matlap sẽ giúp cho các bạn rất nhiều đấy!Mình hiện tại không phát triển trên các kit của Ti nữa mà chuyển sang nhận dạng trực tiếp trên DTDD.
                    Hôm nay phải hơn hôm qua và thua ngày mai!

                    Comment


                    • #11
                      Luồng này vẫn buồn tẻ quá,có lẽ nhận dạng tiếng nói vẫn còn khá mới và hóc với sv VN.Giống như mình ngày xưa cũng tự mần mò mớ tài liệu tiếng anh....

                      Hôm nay dọn nhà thấy có ít tài liệu cũ về nhận dạng tiếng nói,nếu bạn nào ở HCM quan tâm thì liên hệ,mình cho mượn photo....
                      stone_fman@yahoo.com.vn
                      Hôm nay phải hơn hôm qua và thua ngày mai!

                      Comment


                      • #12
                        Tớ thấy cái này cũng khá phù hợp với yêu cầu đấy. Có thể cài đặt trên 1 Vi điều khiển 8-bit được.
                        Tớ cũng thử dịch phần giới thiệu rồi nhưng không trơn tru lắm, đành post nguyên văn lên đây

                        A novel method for recognition of isolated spoken words on an 8-bit microprocessor is presented. The method uses a new but simple
                        feature vector based on the zero-crossings of the speech signal. The feature vector is the histogram of the time-interval between successive
                        zero-crossings of the speech signal. Dynamic time warping is used to calculate a time-aligned normalized distance between the feature vector
                        and the reference templates.
                        The implementation needs only 1-bit A/D conversion and performs all its computations in integer arithmetic. Speaker-dependent
                        recognition accuracy of 95.5% (Matlab) and 85% (microprocessor implementation) are obtained for Hindi digits spoken by 2 male speakers.

                        http://ai.stanford.edu/~asaxena/pape...recognizer.pdf

                        Comment


                        • #13
                          Nguyên văn bởi LeoMessi Xem bài viết
                          Tớ thấy cái này cũng khá phù hợp với yêu cầu đấy. Có thể cài đặt trên 1 Vi điều khiển 8-bit được.
                          Tớ cũng thử dịch phần giới thiệu rồi nhưng không trơn tru lắm, đành post nguyên văn lên đây

                          A novel method for recognition of isolated spoken words on an 8-bit microprocessor is presented. The method uses a new but simple
                          feature vector based on the zero-crossings of the speech signal. The feature vector is the histogram of the time-interval between successive
                          zero-crossings of the speech signal. Dynamic time warping is used to calculate a time-aligned normalized distance between the feature vector
                          and the reference templates.
                          The implementation needs only 1-bit A/D conversion and performs all its computations in integer arithmetic. Speaker-dependent
                          recognition accuracy of 95.5% (Matlab) and 85% (microprocessor implementation) are obtained for Hindi digits spoken by 2 male speakers.

                          http://ai.stanford.edu/~asaxena/papers/speechrecognizer.pdf
                          Mình vừa đọc sơ qua thì thấy đây là một bài toán đơn giản, chưa chắc đã áp dụng cái thuật toán và phương pháp này cho tiếng Việt được.
                          Chỉ là bài toán nhận dạng 10 số đếm Hindi phụ thuộc người nói (ở đây là 2 người nam) và họ cũng không nói rõ môi trường thu âm là như thế nào (có nhiễu hay không?đặt gần mic hay xa) Họ đã phân tích rất đúng, dùng phương pháp ANN quả là không phù hợp với uP 8bit

                          Comment


                          • #14
                            Nhận dạng tiếng nói sử dụng phương pháp notron

                            Nguyên văn bởi starofgod87 Xem bài viết
                            Bạn nào có biết tài liệu nào hay về nhận dạng tiếng nói sử dụng phương pháp notron xin giới thiệu dùm.Nếu có link thì càng tốt.Xin cám ơn nhiều

                            mình có it tài liệu về mạng Notron nè bạn tham khảo qua nhe

                            Comment


                            • #15
                              Nhận dạng tiếng nói sử dụng phương pháp notron

                              các bạn ai cần tham khảo qua nhé
                              Attached Files

                              Comment

                              Về tác giả

                              Collapse

                              antebk Tìm hiểu thêm về antebk

                              Bài viết mới nhất

                              Collapse

                              Đang tải...
                              X