Bước tới nội dung

Thành viên:Đặng Vấn Thiên/Định dạng tệp (File format)

Bách khoa toàn thư mở Wikipedia

Định dạng tệp (File format) là một tiêu chuẩn đề cập đến nội dung và trình tự các bit mã hóa lưu thành tập tin máy tính. Tập tin dạng có thể miễn phí hoặc có phí và cũng có thể là bí mật, hoặc được công bố công khai.

<grammarly-btn>

</grammarly-btn>

Có nhiều loại định dạng cho nhiều loại file khác nhau: ví dụ, PNG là kiểu ảnh bitmap sử dụng thuật toán dữ liệu nén. Những định dạng khác được dùng để lưu nhiều loại dữ liệu khác: OGG là định dạng chứa các loại đa phương tiện bao gồm âm thanhvideo, có hoặc không có văn bản (như phụ đề), và siêu dữ liệu. Một văn bản tập tin có thể chứa bất kỳ kí tự nào kể cả các ký tự điều khiển, và được mã hóa theo một bảng mã. Một số tệp tin như HTML, SVG và các nguồn mã của phần mềm là một tập tin văn bản, với cú pháp riêng cho phép chúng được dùng cho các mục đích cụ thể.

<grammarly-btn>

</grammarly-btn>

Kỹ thuật[sửa | sửa mã nguồn]

<grammarly-btn>

</grammarly-btn>

Định dạng file thường có một đặc tả kỹ thuật riêng mô tả cách mã hóa.Bản mẫu:Elucidate Không phải tất cả các định dạng đều được cung cấp đặc tả miễn phí, một phần vì các nhà phát triển xem đây như bí mật thương mại, và một phần vì các nhà phát triển khác không có đặc tả chính thức.[cần giải thích]

<grammarly-btn>

</grammarly-btn>

Nếu nhà phát triển của một định dạng không công bố đặc tả, một phần mềm muốn sử dụng loại tập tin đó phải đảo ngược tập tin để tìm ra cách để đọc nó hoặc thỏa thuận mua với một chi phí nào đó. Cách tiếp cận thứ hai chỉ có thể thực hiện khi đặc tả có tồn tại và được dùng để kinh doanh. Cả hai cách đều yêu cầu thời gian, tiền, hoặc cả hai. Do đó, định dạng tệp công khai thông thường được hỗ trợ bởi các ứng dụng nhiều hơn.

<grammarly-btn>

</grammarly-btn>

Bằng sáng chế[sửa | sửa mã nguồn]

<grammarly-btn>

</grammarly-btn>

Hơn cả bản quyền, bằng sáng chế thường xuyên được sử dụng để bảo vệ một định dạng tập tin.

<grammarly-btn>

</grammarly-btn>

Xác định loại tập tin[sửa | sửa mã nguồn]

<grammarly-btn>

</grammarly-btn>

Các hệ điều hành khác nhau có những cách khác nhau để xác định những định dạng file, mỗi cách có ưu và nhược điểm riêng. Hiện đại nhất hành hệ thống và các ứng dụng cá nhân cần phải sử dụng tất cả các phương pháp sau đây để đọc "nước" tập tin dạng nếu không làm việc với chúng hoàn toàn.

<grammarly-btn>

</grammarly-btn>

Phần mở rộng[sửa | sửa mã nguồn]

<grammarly-btn>

</grammarly-btn>

Một phương pháp phổ biến được sử dụng bởi nhiều hệ điều hành, bao gồm Windows, Mac, CP/M, DOS, VMS, và VM/CMS, là xác định định dạng của một tập tin dựa trên phần mở rộng trong tên của nó—các chữ cái theo sau dấu chấm (.) cuối cùng..Ví dụ HTML, tài liệu này được xác định theo tên mà kết thúc với .html (hay .') và hình ảnh bởi .gif. Trong gốc , BÉO, hệ thống, tên tập tin đã được giới hạn để một tám-nhân danh và một ba-nhân vật mở rộng, được biết đến như một 8.3 tên. Chỉ có rất nhiều ba-mở rộng thư, vậy thường bất cứ mở rộng có thể có liên quan đến nhiều hơn một chương trình. Nhiều dạng vẫn sử dụng ba-nhân vật mở rộng mặc dù hiện đại hệ điều hành và áp dụng chương trình không còn có giới hạn này. Vì không có danh sách tiêu chuẩn của mở rộng hơn một dạng có thể sử dụng cùng mở rộng, có thể nhầm lẫn cả hệ thống vận hành và sử dụng.

<grammarly-btn>

</grammarly-btn>

Một vật của phương pháp này là hệ thống có thể dễ dàng bị lừa điều trị một tập tin như một định dạng khác chỉ đơn giản bằng cách đổi tên nó—một HTML tập tin có thể ví dụ như thể dễ dàng đối xử như đồng bằng văn bản bằng cách đổi tên nó từ filename.html đến filename.txt. Mặc dù chiến lược này là hữu ích cho chuyên gia những ai có thể dễ dàng hiểu và vận dụng thông tin này, nó đã được thường khó hiểu ít sử dụng kỹ thuật, những người có thể vô tình làm cho một tập tin không sử dụng được (hay "thua" nó) bởi đổi tên nó không chính xác.

Điều này dẫn hơn gần đây điều hành hệ thống vỏnhư Windows 95 và HỆ điều hành Mac X, để che giấu sự mở rộng khi danh sách các tập tin. Này, ngăn cản người dùng từ vô tình thay đổi các tập tin loại, và cho phép sử dụng để tắt tính năng này và hiển thị các mở rộng.

Che giấu việc mở rộng, tuy nhiên, có thể tạo ra sự xuất hiện của hai hoặc nhiều tên trong danh mục. Ví dụ, một biểu tượng công ty có thể là cần thiết cả .eps dạng (cho xuất bản) .png dạng (cho các trang web). Với việc mở rộng thể nhìn thấy, đây sẽ xuất hiện như các tên độc đáo "CompanyLogo.eps" và "CompanyLogo.png". Mặt khác, trốn ẩn phần mở rộng sẽ làm cho cả xuất hiện như là "CompanyLogo".

<grammarly-btn>

</grammarly-btn>

Trốn mở rộng cũng có thể gây nguy hiểm an ninh.[1] Ví dụ, một độc hại người có thể tạo ra một chương trình thực thi với một tên như "Nghỉ photo.jpg.exe". ".vấn" sẽ được ẩn và một người sẽ nhìn thấy "ngày Lễ photo.jpg", mà sẽ xuất hiện để được một JPEG ảnh không thể làm hại các máy tiết kiệm cho lỗi trong các ứng dụng được sử dụng để xem nó. Tuy nhiên, điều hành, hệ thống sẽ vẫn còn thấy ".vấn" mở rộng và vì vậy, chạy chương trình đó, sau đó sẽ có thể gây hại cho các máy tính. Đó là sự thật với các tập tin với chỉ một mở rộng: như nó không xuất hiện, không có thông tin về các tập tin có thể suy luận mà không có một cách rõ ràng điều tra các tập tin. Mở rộng có thể là giả mạo. Một số Từ virus vĩ mô, tạo ra một tập tin Từ trong mẫu định dạng, và tiết kiệm nó với một .DOC mở rộng. Kể từ Từ thường bỏ qua mở rộng và nhìn vào dạng của các tập tin này sẽ mở như mẫu, thực hiện, và truyền vi-rút. Để tiếp tục lừa người sử dụng, nó có thể lưu trữ một biểu tượng trong chương trình, trong trường hợp đó, một số hệ điều hành' biểu tượng chuyển nhượng cho tập tin thực thi (.vấn) sẽ được ghi đè với một biểu tượng thường được sử dụng để đại diện cho JPEG, làm chương trình trông giống như một hình ảnh. Vấn đề này yêu cầu người sử dụng với mở phải thận trọng và không bao giờ để điều hành hệ thống chọn với chương trình gì để mở một tập tin không biết đến là đáng tin cậy (có mâu thuẫn với ý tưởng của làm cho mọi thứ dễ dàng hơn cho các người dùng). Điều này đại diện cho một vấn đề thực tiễn cho hệ thống nơi mở rộng-trốn được bật mặc định.

Dữ liệu nội bộ[sửa | sửa mã nguồn]

Một thứ hai cách để xác định một tin để sử dụng thông tin liên quan đến các dạng được lưu giữ trong các tập tin riêng của mình, hoặc là thông tin có nghĩa là cho mục đích này hoặc nhị phân dây đó xảy ra với luôn luôn được ở vị trí cụ thể trong các tập tin của một số dạng. Kể từ nơi dễ dàng nhất để xác định vị trí họ, là lúc bắt đầu, như khu vực này thường được gọi là một tập tin tiêu đề khi nó lớn hơn một vài nội, hoặc một số kỳ diệu nếu đó chỉ là một vài nội dài.

Đầu tập tin[sửa | sửa mã nguồn]

Các dữ liệu chứa trong một tập tin tiêu đề thường được lưu trữ ở đầu của các tập tin, nhưng có thể có mặt ở các khu vực khác quá, thường kể cả kết thúc, phụ thuộc vào các tập tin dạng hoặc các loại của dữ liệu. Nhân vật dựa trên (văn bản) các tập tin thường có nhân vật dựa trên tiêu đề, trong khi nhị phân định dạng thường có nhị phân tiêu đề, mặc dù điều này không phải là một quy luật. Văn bản, dựa tập tin tiêu đề thường mất thêm không gian, nhưng là con người có thể đọc được, họ có thể dễ dàng được kiểm tra bởi sử dụng đơn giản phần mềm như một biên tập văn bản, hay một lục phân biên tập.

<grammarly-btn>

</grammarly-btn>

Cũng như xác định được các tập tin định dạng, tập tin tiêu đề có thể có dữ liệu về các tập tin và nội dung của nó. Ví dụ, hầu hết các tập tin ảnh cửa hàng thông tin về hình dạng và kích thước và phân giải màu không gian, và tùy chọn tác thông tin như những người làm ảnh ở đâu và khi nó đã được thực hiện, những gì ảnh người mẫu chụp ảnh và thiết bị được sử dụng (Gps), và như vậy. Siêu dữ liệu như thế có thể được sử dụng bởi phần mềm đọc hoặc giải thích các tập tin trong quá trình tải và sau đó.

<grammarly-btn>

</grammarly-btn>

Tập tin tiêu đề có thể được sử dụng bởi một hệ điều hành để nhanh chóng thu thập thông tin về một file mà không cần nạp tất cả vào nhớ, nhưng làm như vậy, sử dụng thêm một tài nguyên máy tính hơn đọc trực tiếp từ các mục thông tin. Ví dụ, khi a đồ họa quản lý tập tin đã hiển thị các nội dung của một thư mục, nó phải đọc các tiêu đề của các tập tin nhiều trước khi nó có thể hiển thị các biểu tượng thích hợp, nhưng chúng sẽ được đặt trong những nơi khác nhau trên các phương tiện lưu trữ đó còn để truy cập. Một mục chứa nhiều các tập tin với phức tạp dữ liệu như thu nhỏ thông tin có thể đòi hỏi nhiều thời gian trước khi nó có thể được hiển thị.

<grammarly-btn>

</grammarly-btn>

Nếu một tiêu đề là nhị phân mã hóa như vậy mà chính nó cần tiêu đề phức tạp giải thích để được công nhận, đặc biệt là dữ liệu nội dung bảo vệ, vì đó là một nguy cơ mà các tập tin dạng có thể bị hiểu sai. Nó thậm chí có thể đã bị ghi vào các nguồn. Điều này có thể gây hỏng dữ liệu đó, trong trường hợp xấu, thậm chí có thể làm cho các tập tin không đọc được.[cần giải thích]

<grammarly-btn>

</grammarly-btn>

Một ví dụ phức tạp hơn của tập tin tiêu đề là những người sử dụng để bao bọc (hoặc thùng) tập tin.

<grammarly-btn>

</grammarly-btn>

Ma thuật số[sửa | sửa mã nguồn]

<grammarly-btn>

</grammarly-btn>

Một cách để kết hợp loại tập tin siêu dữ liệu, thường được kết hợp với Unix và nó dẫn, chỉ là để lưu trữ một "ma thuật số" bên trong các tập tin chính nó. Ban đầu, thuật ngữ này được sử dụng cho một tập hợp cụ thể của 2 loại định vào sự khởi đầu của các tập tin, nhưng kể từ bất nhị chuỗi có thể được coi như một số, mọi tính năng của một dạng tập tin mà duy nhất phân biệt nó có thể được sử dụng để nhận dạng. GIF hình ảnh, ví dụ, luôn luôn bắt đầu với TÊN đại diện của một trong hai GIF87a hoặc GIF89a, tùy thuộc vào các tiêu chuẩn để mà họ tuân thủ. Nhiều loại tập tin, đặc biệt là các tập tin văn bản, khó phát hiện, bởi phương pháp này. HTML tập ví dụ, có thể bắt đầu với chuỗi <html> (đó là không hợp nhạy cảm), hoặc một phù hợp định nghĩa loại tài liệu đó bắt đầu với <!Mã số, HTML>, hoặc, cho phần tử, các XML định danh, đó bắt đầu với <?xml. Các tập tin cũng có thể bắt đầu với ý kiến ngẫu nhiên, văn bản, hay một vài trống rỗng, nhưng vẫn có thể sử dụng MÃ.

<grammarly-btn>

</grammarly-btn>

Số ma thuật tiếp cận cung cấp tốt hơn đảm bảo rằng các dạng sẽ được xác định một cách chính xác, và có thể thường xuyên xác định chính xác hơn thông tin về các tập tin. Kể từ khi hợp lý đáng tin cậy "ma thuật số" kiểm tra có thể được khá phức tạp, và từng thấy phải có hiệu quả được kiểm tra lại mọi khả năng trong những ma thuật cơ sở dữ liệu, phương pháp này là tương đối không hiệu quả, đặc biệt là cho hiển thị lớn danh sách của các tập tin (ngược lại, thấy tên và dữ liệu dựa trên các phương pháp cần phải kiểm tra chỉ có một mảnh của dữ liệu, và kết hợp nó với một sắp xếp chỉ số). Cũng dữ phải được đọc từ những tập tin, tăng độ trễ như trái ngược với dữ liệu lưu trữ trong danh mục. Nơi tập tin loại không cho vay mình để công nhận cách này, hệ thống phải rơi trở lại dữ liệu. Tuy nhiên đây cũng là cách tốt nhất cho một chương trình để kiểm tra nếu các tập tin nó đã được nói để trình này là của các chính xác định dạng: trong khi các tập tin là tên hay dữ liệu có thể được thay đổi một cách độc lập nội dung của nó, không được thiết kế ma thuật số thử nghiệm là một dấu hiệu chắc chắn rằng các tập tin là một phần của các loại sai. Mặt khác, một hợp lệ ma thuật số không đảm bảo rằng các tập tin không bị hỏng hay là của một đúng loại.

Cái gọi là công việc dòng trong kịch bản các tập tin là một trường hợp đặc biệt của ma thuật số. Ở đây, những số ma thuật là con người có thể đọc được chữ để nhận diện một cụ thể dịch lệnh và lựa chọn để được truyền cho các lệnh thông dịch viên.

Một hệ điều hành sử dụng phép thuật số là AmigaOS, nơi ma thuật số được gọi là "Ma thuật Cookies" và đã được chấp nhận là một hệ thống tiêu chuẩn để nhận ra thực thi trong Trai thực thi dạng tập tin và cũng để cho duy nhất chương trình công cụ, và tiện ích đối phó tự động với họ đã lưu dữ liệu, tập tin, hoặc bất kỳ loại khác của tập tin loại khi tiết kiệm và tải dữ liệu. Hệ thống này đã được nâng cao sau đó, với các Amiga chuẩn kiểu dữ liệu nhận dạng. Một phương pháp là FourCC phương pháp, có nguồn gốc từ OSType trên Macintosh, sau đó được chuyển bởi Trao đổi Dạng Tập tin (NẾU) và dẫn.

Bên ngoài siêu dữ liệu[sửa | sửa mã nguồn]

Một cách cuối cùng của lưu trữ các dạng của một tập tin là một cách rõ ràng cửa hàng thông tin về những dạng trong file hệ thống, chứ không phải trong các tập tin chính nó.

Phương pháp này sẽ giúp các dữ liệu từ riêng biệt cả các dữ liệu chính và tên, nhưng cũng là ít di động hơn so với một tập tin mở rộng hoặc "ma thuật số", kể từ dạng đã được chuyển đổi từ tập tin vào hệ thống. Trong lúc này, cũng là sự thật đến một mức độ với tên mở rộng—ví dụ, cho tương thích với DOS là ba nhân vật giới hạn—hầu hết các hình thức của lưu trữ có một khoảng tương đương với định nghĩa của một tập tin dữ liệu và tên, nhưng có thể thay đổi hay không đại diện của một siêu dữ liệu.

Lưu ý rằng các tập tin zip, hay lưu trữ các tập tin giải quyết các vấn đề của xử lý siêu dữ liệu. Một chương trình tiện ích thu thập nhiều dữ liệu cùng nhau cùng với siêu dữ liệu về từng thấy và các thư mục/thư mục họ đến từ tất cả trong một tập tin mới (ví dụ như một tập tin zip với mở rộng .zip). Các tập tin mới là cũng nén và có thể được mã hóa, nhưng bây giờ là bệnh như một tập tin duy nhất trên hệ điều hành bởi FTP hệ thống hoặc gắn liền với email. Tại các điểm đến, nó phải được giải nén bởi một tương thích cụ thể hữu ích, nhưng vấn đề của truyền được giải quyết theo cách này.

Mac loại HỆ điều hành mã[sửa | sửa mã nguồn]

Các Mac HỆ điều hành' Phân cấp File Hệ thống cửa hàng mã cho tạoloại như là một phần của những mục nhập cho mỗi tập tin. Những mã này được gọi là OSTypes. Những mã có thể là bất kỳ 4 trình tự, nhưng thường được chọn vì vậy mà TÊN đại diện, được hình thành một chuỗi có ý nghĩa nhân vật, chẳng hạn như viết tắt của các ứng dụng tên của hoặc sự phát triển của chữ cái đầu. Ví dụ như một HyperCard "chồng" tập tin có một đấng tạo hóa của HOANG dã (từ Hypercard trước đây của tên, "Đại diện") và một loại của STAK. Các BBEdit biên tập văn bản, có một đấng tạo hóa mã của R*ch đề cập đến ban đầu của nó, lập trình viên Giàu Siegel. Kiểu mã ghi rõ các dạng của các tập tin, trong khi các tác giả mã ghi rõ các chương trình để mở nó với đôi khi-nhấn vào người dùng. Ví dụ, các người có thể có một vài văn bản các tập tin với tất cả các loại mã của VĂN bản, nhưng mà từng mở ra một chương trình khác nhau, nhờ có khác nhau giả mã. Đây là dự định như vậy đó, ví dụ, con người có thể đọc được bằng văn bản các tập tin có thể được mở ra trong một mục đích chung biên tập văn bản, trong khi chương trình hay mã các tập tin sẽ mở cửa trong một chuyên biên tập viên hoặc IDE, nhưng tính năng này thường được nguồn gốc của dùng nhầm lẫn mà chương trình sẽ khởi động khi các tập tin đã được nhấp đôi thường là không thể đoán trước. KẾT HỆ điều hành sử dụng một hệ thống tương tự, bao gồm một 12-chút số đó có thể được nhìn lên trong một bàn của mô tả—ví dụ như số thập lục FF5 là "bí danh" để PoScript, đại diện cho một tái Bút tập tin.

Mac HỆ điều hành X loại thống nhận dạng (nhiễm trùng tiểu)[sửa | sửa mã nguồn]

Một Loại Danh (tiền sử về bệnh) là một phương pháp được sử dụng vào hành X duy nhất xác định "đánh máy" lớp học của thực thể, như là tập tin. Nó đã được phát triển bởi Táo như là một sự thay thế cho OSType (loại và tạo mã).

Người tiền sử về bệnh là một nền Tảng cốt Lõi chuỗiđó sử dụng một ngược-DNS chuỗi. Một số thông thường và chuẩn loại sử dụng một miền gọi là công (ví dụ như công cộng.png đối với một Tay đồ Họa Mạng ảnh), trong lĩnh vực khác có thể được sử dụng cho các loại (ví dụ như com.adobe.pdf cho tài Liệu Di động Dạng). Nhiễm trùng tiểu có thể được xác định trong một cấu trúc phân cấp, được biết đến như là một sự phù hợp với hệ thống thứ bậc. Như vậy, công cộng.png phù hợp với một supertype của công chúng.hình ảnh, mà chính nó phù hợp với một supertype của công chúng.dữ liệu. Tiền sử về bệnh có thể tồn tại trong nhiều phân cấp, cung cấp rất linh động.

Ngoài việc tin nhiễm trùng tiểu cũng có thể được sử dụng cho các tổ chức khác mà có thể tồn tại trong HỆ điều hành X, bao gồm:

  • Tông dữ liệu
  • Thư mục (thư mục)
  • Có thể dịch loại (như xử lý bởi các biên Dịch Quản lý)
  • Khung
  • Trực tuyến dữ liệu
  • Bí danh và liên kết tượng trưng

HỆ điều hành/2 thuộc tính mở rộng[sửa | sửa mã nguồn]

Các HPFS, FAT12 và FAT16 (nhưng không 32) hệ cho phép lưu trữ của "thuộc tính mở rộng" với các tập tin. Những bao gồm một thiết lập tùy ý của ba với một cái tên, một mã loại cho những giá trị và một giá trị, mà những tên độc đáo và giá trị có thể lên tới 64 KB dài. Có tiêu chuẩn ý nghĩa đối với một số loại và tên (dưới HỆ điều hành/2). Một trong số đó là rằng ".LOẠI" thuộc tính mở rộng được sử dụng để xác định loại tập tin. Giá trị của nó bao gồm một danh sách của một hay nhiều loại tập tin liên quan đến các tập tin, mỗi đó là một chuỗi, như "Đồng bằng Văn bản" hoặc "dữ liệu". Vì vậy, một tập tin có thể có nhiều loại.

Các SAFARI hệ thống cũng cho phép lưu trữ của HỆ điều hành/2 mở rộng thuộc tính, là một trong những tập tin forksnhưng tính năng này chỉ hiện tại để hỗ trợ HỆ điều hành/2 hệ thống phụ (không có mặt trong WINDOWS), vì vậy Win32 hệ thống xử lý thông tin này như một đục khối dữ liệu và không sử dụng nó. Thay vào đó, nó dựa trên tập tin khác forks để cửa hàng siêu thông tin trong Win32-cụ thể dạng. HỆ điều hành/2 thuộc tính mở rộng vẫn có thể được đọc và viết bởi Win32 chương trình, nhưng các dữ liệu phải được hoàn toàn phân tích bằng ứng dụng.

DOS thuộc tính mở rộng[sửa | sửa mã nguồn]

Quản lý, và giống Unix hệ thống ext2, ext3, ReiserFS phiên bản 3, XFS, JFS, LỚP, và HFS với các tập tin cho phép lưu trữ của thuộc tính mở rộng với các tập tin. Chúng bao gồm một danh sách tùy ý của "tên=giá trị" dây, nơi mà những tên độc đáo và một giá trị có thể được truy cập qua nó liên quan tên.

PRONOM duy nhất định (PUIDs)[sửa | sửa mã nguồn]

Các PRONOM liên Tục nhận Dạng Duy nhất (PUID) là một chuyên gia chương trình của liên tục, độc nhất và rõ ràng nhận dạng tin đó đã được phát triển bởi lưu Trữ Quốc gia của các ANH là một phần của nó PRONOM kỹ thuật vấn vụ. PUIDs có thể được thể hiện như tài Nguyên Thống nhận Dạng cách sử dụng thông tin:pronom/ không gian. Mặc dù chưa được sử dụng rộng rãi bên ngoài của chính phủ ANH và một số kỹ thuật bảo quản các chương trình, PUID chương trình không cung cấp chi tiết hơn so với hầu hết chương trình thay thế.

Kịch CÂM loại[sửa | sửa mã nguồn]

Kịch CÂM loại được sử dụng rộng rãi trong nhiều Internet-liên quan ứng dụng, và ngày càng nhiều nơi khác, mặc dù của họ, sử dụng cho vào đĩa loại thông tin là rất hiếm. Này bao gồm một chuẩn hệ thống nhận dạng (quản lý bởi nhiệm vụ) bao gồm một loại và một loại phụ, tách ra bởi một dấu—ví dụ, văn bản mạnh hoặc ảnh cup. Đây là vốn được coi như là một cách để xác định gì loại tập tin đã được gắn liền với một e-mail, độc lập của các nguồn và mục tiêu điều hành hệ thống. Kịch CÂM loại xác định tin vào mạnh mẽ, AmigaOS 4.0 và chiến thuật thời gian thực, cũng như cửa hàng duy nhất áp dụng chữ ký cho dụng tung ra. Trong AmigaOS và chiến thuật thời gian thực Câm loại hệ thống hoạt động ở song song với Amiga cụ thể sử dụng hệ thống hệ thống.

Có vấn đề với các loại kịch CÂM mặc dù một số tổ chức và mọi người đã tạo ra mình kịch CÂM loại mà không có đăng ký chúng đúng với nhiệm vụ, mà làm cho việc sử dụng các tiêu chuẩn này khó khăn trong một số trường hợp.

Tập tin dạng định (FFIDs)[sửa | sửa mã nguồn]

Tập tin dạng nhận dạng là người khác, không được sử dụng rộng rãi cách để xác định tin dạng theo nguồn gốc của họ, và họ thấy mục. Nó được tạo ra cho các mô Tả Explorer bộ phần mềm. Nó bao gồm nhiều chữ số của các hình thức NNNNNNNNN-x x-YYYYYYY. Phần đầu cho thấy các tổ chức nguồn gốc/duy trì (số này đại diện cho một giá trị trong một công ty/chuẩn tổ chức cơ sở dữ liệu), 2 sau chữ số phân loại tập tin trong lục phân. Phần cuối cùng là, bao gồm các tập tin bình thường mở rộng của các tập tin hoặc tiêu chuẩn quốc tế số các tập tin độn trái với số không. Ví dụ, tin đặc điểm kỹ thuật có FFID của 000000001-31-0015948 nơi 31 chỉ ra một tập tin ảnh, 0015948 là số tiêu chuẩn và 000000001 cho thấy các chuẩn tổ Chức.

<grammarly-btn>

</grammarly-btn>

Tập tin nội dung dựa dạng xác định[sửa | sửa mã nguồn]

Khác, nhưng ít nhất cách để xác định tin để kiểm tra các tập tin nội dung cho phân biệt mẫu trong số các loại tập tin. Các nội dung của một tập tin có một chuỗi các nội và một nghĩa đã 256 hoán vị (0-255). Vì vậy, đếm sự xuất hiện của tần mẫu đó là thường được gọi là tần tần số giấy phép cho phân biệt mẫu để xác định loại tập tin. Có rất nhiều nội dung tập tin dựa trên xác định loại chương trình đó, sử dụng tần phối tần số để xây dựng mô hình đại diện cho loại tập tin và sử dụng bất kỳ và dữ liệu thống kê khai thác kỹ thuật để xác định loại tập tin [2]

Thấy cấu trúc[sửa | sửa mã nguồn]

Có một số loại cách để cấu trúc dữ liệu trong một tập tin. Hầu hết những người bình thường đang mô tả dưới đây.

Không có cấu trúc dạng (nguyên nhớ bãi)[sửa | sửa mã nguồn]

Trước đó dạng tập tin được sử dụng dữ liệu thô dạng mà bao gồm trực tiếp bán phá giá những hình ảnh bộ nhớ của một hay hơn cấu trúc vào các tập tin.

Này, có một số nhược điểm. Trừ khi các hình ảnh bộ nhớ cũng có chỗ dành riêng cho tương lai mở rộng mở rộng và cải thiện này loại cấu trúc thấy là rất khó khăn. Nó cũng tạo ra các tập tin đó có thể là cụ thể để một nền tảng hoặc ngôn ngữ (ví dụ một cấu trúc có một Pascal chuỗi là không được công nhận như vậy trong C). Mặt khác, phát triển công cụ để đọc và viết những loại của các tập tin là rất đơn giản.

Những giới hạn của các cấu trúc dạng, dẫn đến sự phát triển các loại khác của dạng tập tin rằng có thể dễ dàng mở rộng và được tương thích cùng một lúc.

Đoạn dựa trên dạng[sửa | sửa mã nguồn]

Trong này loại thấy cấu trúc, mỗi phần của dữ liệu được nhúng trong một container đó bằng cách nào đó, xác định các dữ liệu. Container của phạm vi có thể xác nhận bởi bắt đầu và kết thúc-các dấu hiệu của một số loại, bởi một rõ ràng chiều dài lĩnh vực nào đó, hoặc bởi cố yêu cầu của các tập tin dạng của nét.

Trong suốt những năm 1970, nhiều chương trình sử dụng định dạng của chung này. Ví dụ, từ bộ vi xử lý như troff, Kịch bảnvà biên Chép, và cơ sở dữ liệu, tập tin xuất khẩu như CSV. Nghệ Thuật điện tử và vị thuyền trưởng-Amiga cũng được sử dụng loại này của dạng tập tin trong năm 1985, với họ NẾU (Trao đổi Dạng Tập tin) dạng tập tin.

Một container là đôi khi được gọi là một đoạn"", mặc dù đoạn "" cũng có ngụ ý rằng từng mảnh nhỏ và/hoặc là khối không chứa khác khối nhiều định không áp đặt những yêu cầu.

Những thông tin nhận dạng một đặc biệt đoạn "" có thể được gọi là nhiều thứ khác nhau, thường điều đó "tên trường", "xác định", "nhãn" hoặc "nhãn". Sự nhận dạng thường con người có thể đọc được và phân loại phần của các dữ liệu: ví dụ, như một "họ", "địa chỉ", "hình chữ", "tên phông chữ". Đây không phải là những điều tương tự như định danh trong các nghĩa của một cơ sở dữ liệu quan trọng hoặc số (mặc dù một số nhận dạng cũng có thể xác định nó liên kết dữ liệu như vậy một chìa khóa).

Với loại thấy cấu trúc công cụ mà không biết vài đoạn nhận dạng chỉ cần bỏ qua những người mà họ không hiểu. Tùy thuộc vào ý nghĩa thực sự của bỏ qua những số liệu này có thể có hoặc không có ích (CSS một cách rõ ràng, xác định như vậy hành vi).

Khái niệm này đã được sử dụng một lần nữa và một lần nữa bởi KHÍA (Microsoft-IBM đương NẾU) LA NĂNG lưu trữ, DER (Phân biệt mã Hóa Quy tắc) suối mã hóa và các tập tin (mà được miêu tả trong CCITT X. 409:năm 1984 và do đó thay NẾU), và dữ Liệu có cấu Trúc Dạng trao Đổi (SDXF).

Thật vậy, bất kỳ dạng dữ liệu phải bằng cách nào đó, xác định được tầm quan trọng của các bộ phận, và nhúng ranh giới-đánh dấu được một cách rõ ràng để làm như vậy:

  • Kịch CÂM đầu làm điều này với một tràng-tách ra nhãn vào đầu mỗi hợp lý dòng. Kịch CÂM tiêu đề không thể chứa khác kịch CÂM đầu, mặc dù các dữ liệu nội dung của một tiêu đề có phần đó có thể được chiết xuất khác của công ước.
  • CSV và tương tự các tập tin thường làm việc này bằng một bản ghi tiêu đề với tên trường, và với dấu phẩy để đánh dấu những ranh giới lĩnh vực. Thích kịch CÂM VÒI đã không cung cấp cho các cấu trúc với hơn một cấp.
  • XML và thân thể lỏng lẻo được coi là một loại đoạn dựa trên định dạng, vì dữ liệu yếu tố được xác định theo đánh dấu đó là giống như đoạn nhận dạng. Tuy nhiên, nó đã chính thức lợi thế như sơ đồ , và xác nhận, cũng như khả năng để đại diện cho phức tạp hơn cấu trúc như cây, Chá, và xếp hạng. Nếu đọc và hiểu được coi là một đoạn "" định dạng, sau đó và người tiền nhiệm của IBM GML là một trong những sớm ví dụ như vậy dạng.
  • HỆT là tương tự chủ mà không có sơ đồ, tham khảo chéo, hoặc một định nghĩa cho ý nghĩa của trường lặp lại tên, và thường là thuận tiện cho lập trình viên.
  • Giao thức đệm là lần lượt tương tự TRONG đáng chú ý thay thế giới-đánh dấu vào các dữ liệu với lĩnh vực số đó là bản đồ để/từ tên của một số bên ngoài, cơ chế.

Mục-dựa dạng[sửa | sửa mã nguồn]

Đây là một mở rộng dạng giống với một file hệ thống (OLE tài Liệu được thực tế hệ), nơi các tập tin là, bao gồm các thư mục' có chứa địa điểm của các dữ liệu trong các tập tin chính nó cũng như chữ ký của nó (và trong một số trường hợp của nó loại). Ví dụ tốt của các loại thấy cấu trúc được hình ảnh đĩa, OLE tài liệu TIFF, thư viện. ĐƯỜNG và DỄ bị Nódựa trên đang chửi rủa và cũng mang theo một mục.

Cũng nhìn thấy[sửa | sửa mã nguồn]

  • Tập tin âm thanh dạng
  • Hóa chất dạng tập tin
  • Chứa kỹ thuật số dạng
  • Tài liệu, tập tin dạng
  • DROID tập tin dạng xác định ích
  • Thấy (lệnh), một xác định loại tập tin hữu ích
  • Tập tin chuyển đổi
  • Tương lai đinh
  • Tập tin hình dạng tóm tắt
  • Hình dạng tập tin
  • Danh sách các tài liệu lưu trữ
  • Danh sách các tập tin dạng
  • Danh sách các tập tin chữ ký, hay "con số ma thuật"
  • Danh sách tên mở rộng (chữ cái)
  • Danh sách các tập tin dạng
  • Danh sách của chuyển động và cử chỉ định dạng tập tin
  • Số ma thuật (lập trình)
  • Tập tin đối tượng
  • Tin dạng
  • Windows loại tập tin

Tài liệu tham khảo[sửa | sửa mã nguồn]

  1. ^ PC World (23 tháng 12 năm 2003). “Windows Tips: For Security Reasons, It Pays To Know Your File Extensions”. Truy cập ngày 20 tháng 6 năm 2008. Đã định rõ hơn một tham số trong |tác giả=|họ= (trợ giúp)Đã định rõ hơn một tham số trong |tác giả=|họ= (trợ giúp); Đã định rõ hơn một tham số trong |tác giả=|họ= (trợ giúp)
  2. ^ “File Format Identification”.

Bên ngoài đường dẫn[sửa | sửa mã nguồn]

[[Thể loại:Định dạng tập tin]]