Machine learning có ý nghĩa gì đối với ngành âm nhạc?

Machine learning là phương pháp sử dụng thuật toán của trí tuệ nhân tạo để phân tích các dữ liệu được cung cấp nhằm hình thành một cơ sở dữ liệu cho riêng nó, được sử dụng cho nhiều mục đích riêng biệt. Trí tuệ nhân tạo (AI) sẽ sử dụng cơ sở dữ liệu này để đưa ra các quyết định cũng như tiên đoán các kết quả trong tương lai. Phương pháp deep learning chính là một sự tiến hóa của machine learning: thay vì cần đến sự theo dõi của con người, các thuật toán có thể tự động hóa quy trình học hỏi bằng các "mạng lưới thần kinh", gần giống với bộ não của con người. Nói dễ hiểu hơn là máy tính có thể tự lập trình học hỏi cho nó và sử dụng các "kiến thức" học được để giải quyết những vấn đề nằm ngoài khả năng của con người.
 
 
Machine learning được sử dụng trong rất nhiều ngành khác nhau, và âm nhạc cũng không phải là ngoại lệ. Các thuật toán khuyến nghị từ dịch vụ stream giúp bạn tìm kiếm những bài hát hay nghệ sỹ mới có thể phù hợp với sở thích nghe của mình chính là một trong số đó. Hồi năm trước, Google Magenta đã nghiên cứu và phát triển Nsynth Super, bộ synthersizer có khả năng sáng tác nhạc dựa trên tính chất của các giai điệu có sẵn.
 
Gần đây nhất có thể nhắc đến Amper Music, một dịch vụ âm nhạc sử dụng AI để phân tích và tự sáng tác nhạc dựa trên các cảm xúc hay phong cách nhạc mà người dùng lựa chọn. Nghệ sỹ Taryn Southern đã sáng tác ca khúc mới của mình bằng sự trợ giúp của Amper Music, hiện đã đạt hơn 2 triệu lượt xem trên YouTube. Tuy nhiên điều này không có nghĩa là AI sẽ làm hết mọi việc mà thay vào đó nó đóng vai trò gần giống với một "cố vấn" hơn. Lấy ví dụ với phần mềm Xtrax Stems 2 của Audionamix sử dụng các clip âm thanh riêng biệt của giọng hát, trống hay tiếng nhạc cụ (gọi là stem) để cung cấp cho nhu cầu remix và mashup nhạc của các DJ.
 
 
Để hiểu thêm về vấn đề này, chúng ta hãy cùng điểm qua các ý chính trong bài phỏng vấn Jonathan Bailey, CTO của iZotope (Ozone, Neutron, Nectar).
 
Thuật ngữ machine learning và deep learning hiện đang được sử dụng ngày càng nhiều. Vậy nói theo cách dễ hiểu nhất thì chúng là gì?
 
Machine learning là kỹ thuật trí tuệ nhân tạo tiên tiến cho phép một hệ thống phân tích và tìm ra những khuôn mẫu trong khối dữ liệu cực lớn, hoặc để đưa ra quyết định cho một dữ liệu hoàn toàn mới. Một ví dụ dễ thấy nhất hiện nay là công nghệ nhận diện khuôn mặt. Phần mềm trên chiếc smartphone có thể chưa bao giờ thấy các hình ảnh của bạn, tuy nhiên nó vẫn có thể phân biệt được các khuôn mặt giống nhau và phân nhóm cho chúng.
 
Trong khoảng 10 năm trở lại đây, sự bùng nổ của dữ liệu kỹ thuật số và tài nguyên máy tính đa dạng đã giúp cho machine learning tiến hóa lên một bậc cao hơn là deep learning. Deep learning sử dụng cấu trúc các "mạng lưới thần kinh" tương tự như bộ não của con người để phân tích, học hỏi và xử lý dữ liệu nhanh hơn nhiều lần so với trước đây.
 
Machine learning / deep learning đã giúp cải thiện các phần mềm làm nhạc như thế nào?
 
iZotope đã nghiên cứu và phát triển kỹ thuật này trong nhiều năm qua. Lấy ví dụ với Neutron sử dụng deep learning để nhận biết các nhạc cụ được sử dụng trong track nhạc, sau đó dựa trên các phân loại và tính chất âm học của âm thanh, nó sẽ đưa ra các khuyến nghị mức dynamic, EQ hay những hiệu ứng âm thanh phù hợp nhất cho track nhạc đó. Deep learning ngoài khả năng phân tích nội dung âm thanh còn có thể xử lý âm thanh nữa.Với RX7, tính năng Music Rebalance sẽ sử dụng deep learning để "unmix" một track nhạc và chia nó thành nhiều "stem" khác nhau, cho phép chỉnh sửa và xử lý âm học dễ dàng hơn. Chúng tôi hiện cũng đang nghiên cứu sử dụng deep learning vào cả quá trình synthesize.
 
Các ưu khuyết điểm là gì?
 
Deep learning đã giải quyết được rất nhiều vấn đề khó khăn trước đây, ví dụ như việc xóa đi các tiếng ồn microphone khi thu âm. Tuy nhiên điểm yếu, hay nói đúng hơn là điểm phiền toái nhất, của nó chính là bạn phải có nguồn dữ liệu lớn cho nó học hỏi, càng nhiều càng tốt. Với các công ty lớn và có nguồn vốn mạnh, họ có thể truy cập các nguồn dữ liệu lớn giúp quy trình học hỏi của AI nhanh và chính xác hơn. Google cho tải về miễn phí TensorFlow nhưng dĩ nhiên sẽ tính phí điện toán đám mây và cũng bảo vệ nghiêm ngặt các dữ liệu riêng của họ.
 
 
Điều này có nghĩa là deep learning không phải là toàn năng. Chúng ta vẫn phải dựa vào nguồn dữ liệu kỹ thuật số cũng như các hệ thống dữ liệu cực lớn. Người dùng nói chung chỉ đánh giá các kết quả đạt được, hiếm có ai quan tâm đến sự khó khăn của quá trình hình thành cơ sở dữ liệu trước khi đưa vào sử dụng.
 
Các nghệ sỹ sẽ sử dụng công nghệ mới ra sao để vẫn giữ lại được tính sáng tạo?
 
Thử lấy ví dụ với Amper Music, chúng ta hoàn toàn có thể sử dụng dữ liệu của nó để viết ra các đoạn nhạc dành cho clip quảng cáo hay nhạc nền video YouTube. Tuy nhiên với một bài nhạc cho con người nghe thì sẽ cần đến cái "hồn" nữa. Deep learning sẽ không thể tạo ra nghệ thuật hoàn chỉnh, nhưng nó có thể giúp các nghệ sỹ làm điều đó dễ dàng và nhanh chóng hơn, cũng như không đòi hỏi họ phải có quá nhiều kiến thức âm nhạc. Nói cách khác, AI không bao giờ có thể thay thế được sự sáng tạo của con người.
 
Thế thì trong tương lai có khi nào các phần mềm sẽ viết và mix nhạc luôn hay không?
 
Nói về việc này thì hiện tại đã có rồi. Nếu bạn là một ca sỹ hay nhạc sỹ nhưng chưa bao giờ sử dụng các phần mềm làm nhạc, deep learning sẽ giúp bạn tự động hóa quy trình đó, bạn chỉ việc sáng tác thôi. Deep learning cũng sẽ học hỏi được rằng bạn thích và không thích cái gì để đưa ra các gợi ý nhanh hơn, chính xác hơn.
Karaoke King 2
SR
Verity
Hanet
Karaoke Crow
Karaoke Đất Quảng
Karaoke Hiền My
Karaoke Hot Boy
Karaoke Hồng Nhung
Karaoke Bảo Trân
Karaoke Diệu Hiền
Karaoke King
Karaoke Idol
Karaoke Chiến Hữu
Karaoke Dạ Thảo Club
Karaoke BIGBANG
Karaoke Mười Vàng
Karaoke X8 KTV
Karaoke Paradise Tam Kỳ
Như Minh Plaza