Thông báo

Collapse
No announcement yet.

Dùng vi điều khiển nào để nhận dạng tiếng nói?

Collapse
X
 
  • Lọc
  • Giờ
  • Show
Clear All
new posts

  • Dùng vi điều khiển nào để nhận dạng tiếng nói?

    Sắp tới em sẽ làm đề tài về nhận dạng tiếng nói. Nhưng em không biết phải sử dụng loại vi điều khiển nào, vậy anh chị nào biết có thể tư vấn giúp em được ko? Và có thể kiếm loại đó ở đâu? Đề tài cũng nhỏ thôi, bộ từ vựng chừng 10 từ. Em xin cảm ơn trước.

  • #2
    đề tài thế mà nhỏ, hihi, theo mình thì trước tiên phải xem bạn muốn mẫu tín hiệu bao nhiêu kbps, tiếng nói thì tối thiểu là 4kbps, mình thấy nên lấy ít nhất 22kbps. vi điều khiển thì dùng AVR là hợp lý, rẻ- tốc độ phù hợp

    Comment


    • #3
      AVR cũng tốt, tuy nhiên trước giờ mình quen xài PIC hơn . Hôm trước có nghe nói mấy bộ DSP của texas, mà hình như mua ở vn không có . Nếu bạn biết loại nào cụ thể thì mình tư vấn cho mình luôn nhé!

      Comment


      • #4
        Nguyên văn bởi npbaoduy Xem bài viết
        Sắp tới em sẽ làm đề tài về nhận dạng tiếng nói. Nhưng em không biết phải sử dụng loại vi điều khiển nào, vậy anh chị nào biết có thể tư vấn giúp em được ko? Và có thể kiếm loại đó ở đâu? Đề tài cũng nhỏ thôi, bộ từ vựng chừng 10 từ. Em xin cảm ơn trước.
        Bạn npbaoduy đã tiến hành được chưa vậy nhỉ?

        Không biết bạn định sử dụng phương pháp nhận dạng nào nhỉ? HMM, ANN, SVM hay là một cái khác.

        Bạn chia sẻ kinh nghiệm nhé.
        Thanks a lot in advance.
        B.R
        ptt3i.

        Comment


        • #5
          Tính dùng HMM, nhưng khó khăn là nếu dùng HMM khối lượng tính toán khá nhiều, chỉ phù hợp khi sử dụng PC (xài Matlab). Nếu dùng lượng tử vector (VQ) thì phù hợp với vi điều khiển hơn, nhưng lại rất hạn chế với bộ từ vựng nhỏ và nhận dạng không được chính xác lắm. ANN thì mình chưa nghiên cứu tới, nếu bạn có cao kiến thì tư vấn giúp mình nhé!

          Comment


          • #6
            Nguyên văn bởi npbaoduy Xem bài viết
            ANN thì mình chưa nghiên cứu tới, nếu bạn có cao kiến thì tư vấn giúp mình nhé!
            Dùng FPGA chạy ANN cũng được đấy bạn ạ (nghe các thầy nói thế )
            123...

            Comment


            • #7
              mình không phải chuyên ngành nên không rành lắm, nhưng cũng có chút kinh nghiệm.
              nếu chỉ truyền nhận tiếng nói thì lấy mẫu 8000 lần/s , tương đương 125us lấy mẫu 1 lần. tốc độ lây mẫu càng cao thì âm thanh càng tốt.
              các bước:
              * tiền khuếch đại tín hiệu âm thanh
              * chuyển đổi ADC
              * lưu trữ- truyền nhận dữ liệu
              * khôi phục dữ liệu số sang dạng tương tự
              * khuyếch đại công suất ra loa

              phần mạch DAC có thể dùng IC chuyên dụng nhưng giá khá đắt, mình dùng phương pháp thang điện trở R2R là rẻ và đơn giản nhất, cách ly tín hiệu ra từ DAC và mạch loa bằng con Opamp (mạch follower) để khỏi bị ảnh hưởng trở kháng ngõ ra DAC.

              Comment

              Về tác giả

              Collapse

              npbaoduy Tìm hiểu thêm về npbaoduy

              Bài viết mới nhất

              Collapse

              Đang tải...
              X