CSV-Datei
CSV-Datei, Character Separated Values, also durch ein bestimmtes Zeichen getrennte Werte, oft auch (nicht ganz korrekt) als Comma Separated Values aufgelöst, weil als Trennzeichen sehr häufig das Komma verwendet wird, bezeichnet eine tabellarisch strukturierte ASCII-Text-Datei (Tabelle einer Datenbank), deren Elemente (Felder) durch ein bestimmtes Trennzeichen getrennt werden. (Texttabelle)Das Trennzeichen darf nicht in Datenelementen vorkommen, oder es muss durch ein Maskierungszeichen als normales Zeichen gekennzeichnet werden. Das Trennzeichen muss nicht das Komma sein, auch Semikolon, Doppelpunkt, Tabulator und andere Zeichen sind üblich.
Einzelne Datensätze werden in der Regel durch einen Zeilenumbruch (bei Windows: CR LF = carriage return, line feed - ASCII 13 und 10; bei Unix: nur LF - ASCII 10; bei MacOS: nur CR - ASCII 13) getrennt. In der ersten Zeile stehen oft die Feldnamen.
Beispiel: Inhalt einer CSV-Datei (hier mit Semikolon als Trennzeichen)
Stunde;Montag;Dienstag;Mittwoch;Donnerstag;Freitag 1;Mathe;Deutsch;Englisch;Mathe;Kunst 2;Sport;Französisch;Geschichte;Sport;Geschichte 3;Sport;Religion ev?;kath;Kunst;Deutsch;KunstIn diesem Beispiel wird das Fragezeichen als Maskierungszeichen verwendet, um das Semikolon zwischen ev und kath in der letzten Zeile als Text zu kennzeichnen. Das 3. Element dieser Zeile würde nach einem Import also Religion ev;kath lauten.
Beim Import einer solchen Texttabelle in eine Tabellenkalkulation o.ä. muss immer angegeben werden, ob die erste Zeile die Feldnamen enthält (hier: ja), welches das Feldtrennzeichen ist (hier: Semikolon), und wie die Datensätze untereinander getrennt sind (hier: CR LF).
Anderes Beispiel:
ID|Kundennummer|Name|Vorname|Anrede 1|123|Mustermann|Karl|Herr 2|453|Mustermann|Sabine|Frau 3|651|Mustersen|Jens|PaterDie ursprüngliche Variante von CSV verwendete als Trennzeichen das Komma (,) und benutzte die Quotierung eines Feldes mit doppelten Hochkommas ("), um sowohl Trennzeichen als auch Zeilenumbrüche im Feldinhalt zuzulassen. Ein Hochkomma im Feldinhalt wurde in alter UNIX-Tradition verdoppelt, ein spezielles Maskierungszeichen war hier nicht vorgesehen. Unquotierte Leerzeichen vor und hinter einem Trennzeichen wurden ignoriert.
Ein Beispiel:
Zeile 1, Zeile 1 , Zeile 1 , Zeile 1 Zeile 2, "Zeile 2", "Zeile ""No"" 2", "Zeile 2" "Zeile 3", "Zeile 3", "Zeile 3", "Zeile 3"CSV-Dateien tragen auch oft die Dateiendung .txt, statt .csv und können auch in jedem Texteditor erstellt und bearbeitet werden.
Das CSV-Dateiformat wird oft benutzt um Daten zwischen unterschiedlichen Computerprogrammen auszutauschen (es ist also ein Austauschformat). Die Verwendung des Formateses in der von Microsoft Excel verwendeten Form hat sich als Pseudostandard etabliert. Für neuere Anwendungen wird XML verwendet.
siehe auch: ASCII