Updated: Nov 12, 2020
Source: https://www.technologyreview.com/2020/10/30/1011435/ai-fourier-neural-network-cracks-navier-stokes-and-partial-differential-equations/
Soạn bởi: Karen Hao

Nếu bạn không phải là một nhà vật lý hoặc một kỹ sư thì sẽ không có nhiều cơ hội để bạn biết về phương trình đạo hàm riêng. Sau nhiều năm nghiền ngẫm chúng ở bậc đại học khi học kỹ thuật cơ khí, tác giả cũng chưa bao giờ sử dụng chúng trong thế giới thực.

Các phương trình vi phân từng phần (tiếng Anh là: partial differential equations, viết tắt là PDEs) là một loại phương trình toán học được dùng để mô tả sự thay đổi theo không gian và thời gian nên rất hữu ích để mô tả các hiện tượng vật lý trong vũ trụ của chúng ta. Chúng có thể được sử dụng để mô hình hóa mọi thứ, từ quỹ đạo hành tinh đến kiến tạo mảng (plate tectonics) cho đến sự nhiễu loạn không khí mà có thể ảnh hướng đến các chuyến bay. Từ đó cho phép chúng ta làm những việc thực tế như dự đoán hoạt động địa chấn và thiết kế máy bay an toàn.

Vấn đề là PDE nổi tiếng là khó giải quyết. Và ở đây, ý nghĩa của việc "giải quyết" có lẽ được minh họa tốt nhất bằng một ví dụ. Giả sử bạn đang cố gắng mô phỏng sự nhiễu loạn không khí để thử nghiệm một thiết kế máy bay mới. Có một PDE đã được biết tới gọi là Navier-Stokes được sử dụng để mô tả chuyển động của bất kỳ chất lỏng nào. Việc giải được Navier-Stokes sẽ cho phép chúng ta chụp nhanh chuyển động của không khí (còn gọi là điều kiện gió (wind conditions)) tại bất kỳ thời điểm nào và mô hình hóa cách nó sẽ tiếp tục chuyển động hoặc cách nó chuyển động trước đó.

Các phép tính này rất phức tạp và chuyên sâu về tính toán, đó là lý do tại sao các ngành sử dụng nhiều PDE thường dựa vào siêu máy tính để thực hiện phép toán. Đó cũng là lý do tại sao lĩnh vực AI lại quan tâm đặc biệt đến những phương trình này. Nếu chúng ta có thể sử dụng học sâu để tăng tốc quá trình giải quyết chúng, nó có thể giúp ích rất nhiều cho việc nghiên cứu khoa học và kỹ thuật.

Giờ đây, các nhà nghiên cứu tại Caltech đã giới thiệu một kỹ thuật học sâu mới để giải các PDE chính xác hơn đáng kể so với các phương pháp học sâu được phát triển trước đây. Nó cũng dễ tổng quát hơn, có khả năng giải toàn bộ họ PDE - chẳng hạn như phương trình Navier-Stokes cho bất kỳ loại chất lỏng nào - mà không cần phải train lại. Cuối cùng, nó nhanh hơn 1.000 lần so với các công thức toán học truyền thống, điều này sẽ giúp chúng ta giảm bớt sự phụ thuộc vào siêu máy tính và tăng khả năng tính toán của chúng ta để mô hình hoá các vấn đề lớn hơn.

Mạng neural và PDE

Điều đầu tiên cần hiểu ở đây là mạng neural về cơ bản là các bộ xấp xỉ hàm. Tưởng tượng về việc xây dựng một hệ thống nhận diện con mèo. Chúng ta  mạng neural bằng cách đưa vào nhiều hình ảnh về con mèo và những thứ hình khác phải là mèo và gắn nhãn mỗi nhóm tương ứng là 1 hoặc 0. Sau đó, mạng neural sẽ tìm hàm tốt nhất có thể chuyển đổi từng hình ảnh của một con mèo thành label 1 và từng hình ảnh của các con khác thành 0. Đó là cách nó có thể nhìn vào một hình ảnh mới và cho bạn biết đó có phải là một con mèo hay không. Nếu quá trình train tốt, hệ thống sẽ luôn dự đoán đúng.

Tiến trình xấp xỉ hàm này là những gì chúng ta cần để giải một PDE. Chúng ta đang cố gắng tìm ra một hàm mô tả tốt nhất, chẳng hạn như chuyển động của các hạt không khí trong không gian và thời gian vật lý.

Bây giờ đây là mấu chốt của bài báo. Mạng neural thường được train để xấp xỉ các hàm giữa inputs and outputs được định nghĩa trong không gian Euclide với đồ thị cổ điển của bạn với các trục x, y và z. Nhưng lần này, các nhà nghiên cứu định nghĩa các inputs and outputs trong không gian Fourier, đây là một dạng đồ thị đặc biệt để vẽ các tần số sóng. Anima Anandkumar, một giáo sư ở Caltech, người giám sát nghiên cứu cùng với các đồng nghiệp của cô, giáo sư Andrew Stuart và Kaushik Bhattacharya, cho biết trực giác mà họ rút ra khi làm việc trong các lĩnh vực khác nhau là một cái gì đó giống như chuyển động của không khí thực sự có thể được mô tả như một sự kết hợp của các tần số sóng. Chiều hướng chung của gió ở cấp độ vĩ mô giống như tần số thấp với các sóng rất dài và chậm, trong khi các xoáy nhỏ hình thành ở cấp vi mô giống như tần số cao với tần số rất ngắn và nhanh.

Vì sao có vấn đề này? Bởi vì việc ước lượng một hàm Fourier trong không gian Fourier dễ dàng hơn nhiều so với việc giải các PDE trong không gian Euclide, điều này giúp đơn giản hóa đáng kể công việc của mạng neural. Về độ chính xác và hiệu quả chính: ngoài lợi thế về tốc độ rất lớn so với các phương pháp truyền thống, kỹ thuật của họ đạt được tỷ lệ lỗi khi giải Navier-Stokes thấp hơn 30% so với các phương pháp học sâu trước đây.

Nghiên cứu này cực kỳ hữu ích và ngoài ra còn mang tính khái quát. Các phương pháp học sâu trước đây phải được train riêng cho từng loại chất lỏng, trong khi phương pháp này chỉ cần được train một lần để xử lý chung cho tất cả, theo như kết quả thí nghiệm của họ đã cho thấy. Mặc dù họ chưa thử mở rộng điều này cho các ví dụ khác, nó có thể xử lý các earth composition khác khi giải các PDE liên quan đến hoạt động địa chấn hoặc các loại vật liệu khi giải quyết các PDE liên quan đến dẫn nhiệt.

Siêu mô phỏng (Super-simulation)

Các giáo sư và nghiên cứu sinh của họ không thực hiện nghiên cứu này chỉ để giải trí về lý thuyết. Họ muốn đưa AI vào các lĩnh vực khoa học hơn. Qua việc nói chuyện với các cộng tác viên khác nhau làm việc trong lĩnh vực khoa học khí hậu, địa chấn học và khoa học vật liệu, Anandkumar là người đầu tiên cố gắng giải PDE cùng với các đồng nghiệp và sinh viên của mình. Hiện họ đang làm việc để đưa phương pháp của mình vào thực tế cùng với các nhà nghiên cứu khác tại Caltech và Phòng thí nghiệm Quốc gia Lawrence Berkeley.

Một chủ đề nghiên cứu mà Anandkumar đặc biệt quan tâm là: biến đổi khí hậu. Navier-Stokes không chỉ hữu ích trong việc mô hình hoá nhiễu loạn không khí mà nó còn được sử dụng để lmô hình hoá các mẫu thời tiết weather patterns. Anandkumar nói: "Có được những dự đoán thời tiết tốt, chi tiết trên quy mô toàn cầu là một vấn đề đầy thách thức và ngay cả trên những siêu máy tính lớn nhất, chúng tôi cũng không thể làm được điều đó ở quy mô toàn cầu ngày nay. Vì vậy, nếu chúng ta có thể sử dụng những phương pháp này để tăng tốc toàn bộ hệ thống, điều đó sẽ có tác động rất lớn".

Ngoài ra còn rất nhiều, rất nhiều ứng dụng khác, Anandkumar nói thêm rằng: "Theo nghĩa đó, bầu trời là giới hạn, vì chúng ta có một cách chung để tăng tốc tất cả các ứng dụng này."