Die Text Encoding Initiative ( TEI) ist eine Organisation und ein Dateiformat für Dokumente. Als Dateiformat eignet sich das TEI-Format für den Austausch von Texten.
Das in der Document Type Definition ( DTD) festgelegte TEI-Format basiert auf der Standardized Generalized Markup Language ( SGML) und der Extensible Markup Language ( XML).
Das TEI-Dateiformat eignet sich für Bearbeitung von Texten, Tabellen und Sprachinformationen. Das Dateiformat besteht aus einem Header, der Metadaten enthält. Im Header werden zudem Datenkategorien festgelegt: Beschreibung der Datei, Beschreibung der Codierung, Textprofil und Dokumentation von Revisionen.