chuẩn hóa
/ˌnɔːməlaɪˈzeɪʃn//ˌnɔːrmələˈzeɪʃn/The term "normalization" originated in the 19th century in the field of medicine. In the 1840s, the German physician Hermann von Helmholtz used the term "Normalisation" to describe the process of making measurements and observations of bodily functions and physical phenomena as if they were typical or average. This concept was later applied to other fields such as biology, psychology, and sociology. In the mid-20th century, the term gained popularity in the field of social sciences and economics. Normalization became synonymous with the process of making data conform to a standard or average value, often used to simplify complex data or to make it easier to compare and analyze. In the 1970s and 1980s, the term spread to the field of computer science, particularly in the context of database management systems, where normalization refers to the process of organizing data into tables to minimize data redundancy and improve data integrity.
Trong giai đoạn xử lý dữ liệu trước, chúng tôi đã áp dụng chuẩn hóa cho các tính năng số để đảm bảo rằng mỗi tính năng có giá trị trung bình bằng 0 và độ lệch chuẩn bằng 1, đây là một kỹ thuật phổ biến được gọi là chuẩn hóa.
Các tín hiệu vô tuyến nhận được từ không gian thường dễ bị nhiễu và méo tiếng, khiến việc trích xuất thông tin có ý nghĩa trở nên khó khăn. Để giảm thiểu điều này, chúng tôi đã áp dụng các kỹ thuật chuẩn hóa để chuẩn hóa các tín hiệu thành biên độ chuẩn, giúp phân tích và hiểu dễ dàng hơn.
Trong các ứng dụng nhận dạng giọng nói, các tín hiệu đầu vào thay đổi rất nhiều về âm lượng và tần số, khiến việc phân loại chính xác các từ trở nên khó khăn. Chuẩn hóa được sử dụng để chuẩn hóa các tín hiệu theo cùng một tỷ lệ, giảm độ phức tạp và cải thiện hiệu suất của hệ thống.
Trong các ứng dụng xử lý hình ảnh, chuẩn hóa được sử dụng để chuẩn hóa các giá trị pixel của hình ảnh thành một phạm vi nhất định, chẳng hạn như [0, 1] hoặc [-1, 1], giúp việc đào tạo và kiểm tra các mô hình nhận dạng hình ảnh trở nên dễ dàng hơn và hiệu quả hơn.
Dữ liệu chuỗi thời gian tài chính thường có độ biến thiên cao, khiến việc trích xuất các mẫu và xu hướng hữu ích trở nên khó khăn. Để khắc phục điều này, các kỹ thuật chuẩn hóa như chuẩn hóa điểm Z hoặc chuẩn hóa Max-Min được áp dụng để chuẩn hóa dữ liệu theo phân phối hoặc phạm vi chuẩn.
Trong các ứng dụng xử lý ngôn ngữ tự nhiên, chuẩn hóa được áp dụng cho dữ liệu văn bản để chuẩn hóa tần suất của các từ, loại bỏ các từ ít dùng và dừng các từ, giúp việc học ngữ nghĩa của ngôn ngữ dễ dàng hơn.
Trong các ứng dụng xử lý tín hiệu, chuẩn hóa được áp dụng cho các tín hiệu để loại bỏ bất kỳ giá trị null hoặc offset nào, đảm bảo rằng các tín hiệu được tập trung quanh số 0, giúp xử lý và phân tích dễ dàng hơn.
Trong các cảm biến hóa học có công nghệ trí tuệ nhân tạo, các cảm biến đo nồng độ hóa chất, trình bày dữ liệu ở dạng tương tự đòi hỏi phải chuẩn hóa. Chuẩn hóa khắc phục sự dịch chuyển và phương sai trong các cảm biến khác nhau để tạo ra dữ liệu thống nhất, góp phần phân tích đáng tin cậy và chính xác hơn.
Trong lĩnh vực kỹ thuật, chuẩn hóa quy trình là một kỹ thuật phổ biến được sử dụng để giảm sự thay đổi trong quy trình do thay đổi theo mùa, thay đổi nguyên liệu thô hoặc thay đổi trong chính hệ thống sản xuất. Bằng cách chuẩn hóa quy trình, dễ dàng xác định độ lệch và nguyên nhân gốc rễ, cho phép hành động khắc phục kịp thời.
Trong một số ứng dụng khoa học, chuẩn hóa chuẩn (còn được gọi là chuẩn hóa điểm z)