Definition of corpus




The word "corpus" is derived from the Latin word "corpus," which means "body" or "whole." In its earliest uses, "corpus" referred to the physical body of a living being, as well as to the physical bodies of inanimate objects. In the context of legal and academic scholarship, the term "corpus" came to be used to refer to a collection or body of texts, such as a collection of laws or a body of scientific knowledge. The term "corpus juris civilis," for example, refers to a collection of legal texts that were compiled by the Byzantine emperor Justinian in the 6th century AD. In modern usage, "corpus" is often used to refer to a large, organized collection of texts that are used for research or analysis, such as a corpus of spoken English or a corpus of scientific papers. The use of the term "corpus" in this context reflects

  • The linguistic corpus contains a vast collection of written and spoken texts in various languages, which can be analyzed to study language structure and usage.

    Ngữ liệu ngôn ngữ chứa một bộ sưu tập lớn các văn bản viết và nói bằng nhiều ngôn ngữ khác nhau, có thể được phân tích để nghiên cứu cấu trúc và cách sử dụng ngôn ngữ.

  • As a language learner, I have been studying a corpus of French grammar to improve my skills in understanding native speakers' conversations.

    Là một người học ngôn ngữ, tôi đã nghiên cứu một khối ngữ pháp tiếng Pháp để cải thiện kỹ năng hiểu các cuộc trò chuyện của người bản ngữ.

  • The corpus of medieval English texts provides valuable insights into the evolution of the English language from its earliest forms to the present day.

    Kho tàng văn bản tiếng Anh thời trung cổ cung cấp những hiểu biết có giá trị về quá trình phát triển của tiếng Anh từ những hình thức ban đầu cho đến ngày nay.

  • By analyzing a corpus of literary texts from different genres and time periods, we can identify common patterns of language usage and determine the evolution of writing styles.

    Bằng cách phân tích tập hợp các văn bản văn học từ nhiều thể loại và thời kỳ khác nhau, chúng ta có thể xác định các mô hình sử dụng ngôn ngữ chung và xác định sự phát triển của các phong cách viết.

  • The digital corpus of endangered languages is a crucial resource for preserving and documenting these vulnerable linguistic traditions.

    Kho dữ liệu kỹ thuật số về các ngôn ngữ có nguy cơ tuyệt chủng là nguồn tài nguyên quan trọng để bảo tồn và ghi chép lại các truyền thống ngôn ngữ dễ bị tổn thương này.

  • The corpus of scientific articles in a particular field can be analyzed to identify the most frequently used vocabulary and language structures, which can help researchers to communicate their findings more effectively.

    Có thể phân tích kho dữ liệu các bài báo khoa học trong một lĩnh vực cụ thể để xác định từ vựng và cấu trúc ngôn ngữ được sử dụng thường xuyên nhất, giúp các nhà nghiên cứu truyền đạt phát hiện của mình hiệu quả hơn.

  • A corpus of legal documents can be used to examine the usage and interpretation of legal terminology, as well as to identify trends in legal language over time.

    Có thể sử dụng một tập hợp các văn bản pháp lý để kiểm tra cách sử dụng và diễn giải thuật ngữ pháp lý, cũng như xác định xu hướng trong ngôn ngữ pháp lý theo thời gian.

  • The corpus of economic data and text is a vital resource for economists and financial analysts, as it allows them to identify patterns and trends in economic language usage and behavior.

    Kho dữ liệu và văn bản kinh tế là nguồn tài nguyên quan trọng đối với các nhà kinh tế và phân tích tài chính vì nó cho phép họ xác định các mô hình và xu hướng trong cách sử dụng và hành vi ngôn ngữ kinh tế.

  • In linguistics, a corpus is used to compare the linguistic features of different languages, shedding light on language families and their relationships to one another.

    Trong ngôn ngữ học, ngữ liệu được sử dụng để so sánh các đặc điểm ngôn ngữ của các ngôn ngữ khác nhau, làm sáng tỏ các ngữ hệ và mối quan hệ của chúng với nhau.

  • The corpus of autobiographical writings can provide important insights into the author's personal and cultural background, as well as their use of language as a means of expressing themselves.

    Tập hợp các tác phẩm tự truyện có thể cung cấp những hiểu biết quan trọng về hoàn cảnh cá nhân và văn hóa của tác giả, cũng như cách họ sử dụng ngôn ngữ như một phương tiện để thể hiện bản thân.

