Die Unicode Transformation Formats (UTF) sind definierte Formate für die Umwandlung des Unicode für die elektronische Verarbeitung. Mit den Unicode Transformation Formats können 16- Bit-Zeichencodes in 8 Bit umgewandelt werden.
Die Zeichen im UTF-Format werden von einer unterschiedlichen Anzahl an Bytes dargestellt und gehören zu den Double Byte Character Sets ( DBCS), deren Zeichen aus zwei Bytes bestehen, und den Multibyte Character Sets ( MBCS), deren Zeichen aus zwei und mehr Bytes bestehen. Bekannte UTF-Formate sind UTF-7, UTF-8, UTF-16 und UTF-32.