danh từ, số nhiều corpora
tập sao lục, tập văn
(sinh vật học) thể
corpus striatum: thể vân
CORPUS
/ˈkɔːpəs//ˈkɔːrpəs/Từ "corpus" bắt nguồn từ tiếng Latin "corpus," có nghĩa là "body" hoặc "toàn bộ". Trong những lần sử dụng đầu tiên, "corpus" dùng để chỉ cơ thể vật lý của một sinh vật sống, cũng như cơ thể vật lý của các vật thể vô tri. Trong bối cảnh học thuật và pháp lý, thuật ngữ "corpus" được sử dụng để chỉ một tập hợp hoặc một khối văn bản, chẳng hạn như một tập hợp các luật hoặc một khối kiến thức khoa học. Ví dụ, thuật ngữ "corpus juris civilis," dùng để chỉ một tập hợp các văn bản pháp lý do hoàng đế Byzantine Justinian biên soạn vào thế kỷ thứ 6 sau Công nguyên. Trong cách sử dụng hiện đại, "corpus" thường được dùng để chỉ một tập hợp lớn, có tổ chức các văn bản được sử dụng cho mục đích nghiên cứu hoặc phân tích, chẳng hạn như một tập hợp các văn bản tiếng Anh nói hoặc một tập hợp các bài báo khoa học. Việc sử dụng thuật ngữ "corpus" trong ngữ cảnh này phản ánh
danh từ, số nhiều corpora
tập sao lục, tập văn
(sinh vật học) thể
corpus striatum: thể vân
Ngữ liệu ngôn ngữ chứa một bộ sưu tập lớn các văn bản viết và nói bằng nhiều ngôn ngữ khác nhau, có thể được phân tích để nghiên cứu cấu trúc và cách sử dụng ngôn ngữ.
Là một người học ngôn ngữ, tôi đã nghiên cứu một khối ngữ pháp tiếng Pháp để cải thiện kỹ năng hiểu các cuộc trò chuyện của người bản ngữ.
Kho tàng văn bản tiếng Anh thời trung cổ cung cấp những hiểu biết có giá trị về quá trình phát triển của tiếng Anh từ những hình thức ban đầu cho đến ngày nay.
Bằng cách phân tích tập hợp các văn bản văn học từ nhiều thể loại và thời kỳ khác nhau, chúng ta có thể xác định các mô hình sử dụng ngôn ngữ chung và xác định sự phát triển của các phong cách viết.
Kho dữ liệu kỹ thuật số về các ngôn ngữ có nguy cơ tuyệt chủng là nguồn tài nguyên quan trọng để bảo tồn và ghi chép lại các truyền thống ngôn ngữ dễ bị tổn thương này.
Có thể phân tích kho dữ liệu các bài báo khoa học trong một lĩnh vực cụ thể để xác định từ vựng và cấu trúc ngôn ngữ được sử dụng thường xuyên nhất, giúp các nhà nghiên cứu truyền đạt phát hiện của mình hiệu quả hơn.
Có thể sử dụng một tập hợp các văn bản pháp lý để kiểm tra cách sử dụng và diễn giải thuật ngữ pháp lý, cũng như xác định xu hướng trong ngôn ngữ pháp lý theo thời gian.
Kho dữ liệu và văn bản kinh tế là nguồn tài nguyên quan trọng đối với các nhà kinh tế và phân tích tài chính vì nó cho phép họ xác định các mô hình và xu hướng trong cách sử dụng và hành vi ngôn ngữ kinh tế.
Trong ngôn ngữ học, ngữ liệu được sử dụng để so sánh các đặc điểm ngôn ngữ của các ngôn ngữ khác nhau, làm sáng tỏ các ngữ hệ và mối quan hệ của chúng với nhau.
Tập hợp các tác phẩm tự truyện có thể cung cấp những hiểu biết quan trọng về hoàn cảnh cá nhân và văn hóa của tác giả, cũng như cách họ sử dụng ngôn ngữ như một phương tiện để thể hiện bản thân.