Neu vorgestellt, Programmierung

Schreiben, aber richtig

Mit dem CtxDocEdit stellt CONZEPT 16 dem Entwickler ein Objekt zur Verfügung, mit dem sich eine professionelle Textverarbeitung realisieren lässt. Neben Funktionen wie zum Beispiel die Verarbeitung unterschiedlicher Datei- und Bildformate oder Kopf- und Fußzeilenverwaltung gehört auch eine Rechtschreibprüfung zum Umfang einer komfortablen Textverarbeitung.

In der bisherigen Version von CONZPEPT 16 hat der Anwender die Möglichkeit, eine Rechtschreibprüfung für die deutsche und englische Sprache zu aktivieren.


Ab der kommenden Version 5.7.08 bietet CONZEPT 16 die Möglichkeit, die Wörterbücher um benutzerdefinierte Wörterbücher zu erweitern. Wie die konkrete Umsetzung aussieht, möchte ich in diesem Artikel aufzeigen.
Aufbau eines benutzerdefinierten Wörterbuchs

Die Basis für die Rechtschreibprüfung bildet das Wörterbuch. Ist die Überprüfung aktiv, werden die Wörter im Textdokument mit dem Wörterbuch abgeglichen und fehlerhafte oder unbekannte Begriffe mit einer roten Zickzacklinie unterstrichen.

Damit das DocEdit-Objekt bzw. der zugrunde liegende Spell-Checker das selbsterstellte Wörterbuch verarbeiten kann, muss dieses im sogenannten Tlx-Format (Text Lexicon) vorliegen. Dabei handelt es sich um eine zeilenbasierte Textdatei. Jeder Begriff steht in einer separaten Zeile, gefolgt von einem Tab und einem Schlüssel. Der Schlüssel sagt aus, wie der Begriff zu interpretieren ist.
Hinzufügen eines benutzerdefinierten Wörterbuchs

Damit der Text mit dem benutzerdefinierten Wörterbuch abgeglichen werden kann, muss dieses dem DocEdit-Objekt hinzugefügt werden. Das Hinzufügen geschieht über die neue Funktion WinDocUserDictAddName(). An dieser Stelle ist zu erwähnen, dass über diese Funktion auch mehrere Wörterbücher gleichzeitig geladen werden können. Der Spell-Checker berücksichtig grundsätzlich alle dem DocEdit-Objekt hinzugefügten Wörterbücher. Für das Entladen einzelner Wörterbücher steht die Funktion WinDocUserDictRemoveName() zur Verfügung.
Hinzufügen von Wörtern während der Texterfassung

Benutzerdefinierte Wörterbücher eignen sich auch für das Erweitern der deutschen oder englischen Wörterbücher. Da diese Wörterbücher die am häufigsten verwendeten Wörter enthalten, werden in der Regel Eigennamen, Abkürzungen oder technische Begriffe nicht erkannt und als Fehler gekennzeichnet.

Für eine Umsetzung benötigen wir zwei Funktionen. Die eine Funktion ermittelt den fehlerhaften Begriff, die andere Funktion schreibt diesen Begriff in das benutzerdefinierte Wörterbuch.

Ermitteln eines fehlerhaften Wortes

sub GetMisspelledWord() : alpha
{
  // Position des Wortes als Startpunkt für die Selektion verwenden
  gCtxDocEdit->cpiSelStart  # gCtxDocEdit->cpiMisspelledWordStart(gIdx)
  // Länge der Selektion auf die Länge des Wortes setzen
  gCtxDocEdit->cpiSelLength # gCtxDocEdit->cpiMisspelledWordLength(gIdx)
  // Selektiertes Wort ermitteln
  return (gCtxDocEdit->CpaSelText);
}

Ob in einem Textdokument zu korrigierende Begriffe vorhanden sind, lässt sich mit Hilfe der Eigenschaft cpiMisspelledWords ermitteln. Die Eigenschaft gibt die Anzahl der fehlerhaften Begriffe zurück. Falsch geschriebene bzw. unbekannte Begriffe werden vom DocEdit-Objekt von Anfang bis Ende des Textes durchnummeriert.

Obige Funktion ermittelt einen fehlerhaften Begriff und stellt diesen im Text selektiert dar.
Die Eigenschaft cpaSeltext liefert den selektierten Begriff als String zurück. Den Eigenschaften cpiMisspelledWordStart und cpiMisspelledWordLength wird als Argument die Nummer des Wortes übergeben.

Entscheidet sich der Anwender dieses Wort in das benutzerdefinierte Wörterbuch aufzunehmen, kommt nachfolgende Funktion zur Anwendung.

Einfügen eines Wortes in das Wörterbuch

Sub WriteDictionary(aWord : alpha(84))
{
  // Zeiger auf den Anfang der Datei setzen
  gFile->FsiSeek(0);
  // Wörterbuch in Memory-Objekt einlesen
  gFile->FsiReadMem(gMem,1,gFile->FsiSize());

  // Wenn Begriff nicht vorhanden
  if (gMem->MemFindStr(1,gMem->SpLen,aWord,_StrFindToken) = 0)
  {
    // Begriff um Tab, Schlüssel und Zeilenumbruch erweitern
    aWord # aWord + mTab + 'i' + mCRLF;
    // Zeiger an das Ende der Datei setzen
    gFile->FsiSeek(gFile->FsiSize());
    //Datei schreiben
    gFile->FsiWrite(aWord);
  }
  // Wörterbuch entfernen
  gCtxDocEdit->WinDocUserDictRemoveName(mPath + '\MyDic.tlx');
  // Wörterbuch hinzufügen
  gCtxDocEdit->WinDocUserDictAddName(mPath + '\MyDic.tlx');
}

Nach dem Schreiben der Datei muss das Wörterbuch neu hinzugefügt werden, damit der Spell-Checker das Wort als korrekt akzeptiert.

DocEdit mit Rechtschreibprüfung
2 Kommentare

2 Kommentare “Schreiben, aber richtig”

  1. @Klaus
    Das Wörterbuch muss als externe Datei vorliegen, damit der Spell-Checker darauf zugreifen kann.
    Ungeachtet dessen können Sie das Wörterbuch als BLOb in der Datenbank ablegen. Vor Verwendung muss dieses aber exportiert werden.

    Eine Offline-Version der Dokumentation gibt seitens TX Text Control nicht.

  2. CtxDocEdit ist eine sehr nützliche Erweiterung der C16-Datenbank und die geplante Verwendung von benutzerdefinierten Wörterbüchern erhöt diesen Nutzen noch. Allerdings stellt sich die Frage, wo dieses Wörterbuch gespeichert wird. So wäre es schön, wenn neben der lokalen Möglichkeit eines individuellen Wörterbuches auch die Möglichkeit eines zentralen "Fachwörterbuches" bestünde, so dass dieses Fachwörterbuch allen Nutzern der Datenbank gleichermassen zur Verfügung steht und die Eintragungenin dieses Wörterbuch z.B. über die Datenbank erfolgen, so dass das Wörterbuch auch geschützt bei den Datenbanken abgespeichert sein könnte (oder eine Speicherung als "Blob" innerhalb der Datenbank) – oder bleibt einem alternativ nur der Weg über ein im Netz freigegebenes Verzeichnis ?
    Gibt es eigentlich auch eine "offline"-Hilfe zu CtxDocEdit oder nur die online-Hilfe (http://www.textcontrol.com/en_US/support/documentation/activex/).

Kommentar abgeben