Vorſtellungsrunde

Funktion, Verbeſſerungsvorſchläge

Re: Vorſtellungsrunde

Beitragvon mach » 2013-06-29, 18:23

Willkommen Ruhmwolf

Ich bitte ſehr um Entſchuldigung, daſs ich deinen Beitrag erſt jetzt freigeſchaltet habe. Ich hatte angenommen, daſs ich über freizuſchaltende Beiträge automatiſch benachrichtigt würde. Anſcheinend nicht.

Aha, LaTeX-Erfahrung! Selber habe ich meine Magiſterarbeit in LaTeX geſchrieben, womit ich allerdings in der Germaniſtik eher eine Ausnahme geweſen bin.

Es ſtimmt, die hier verwendete Schrift gehört eher zur breiten, ſchwarzen Sorte. Es liegt einfach daran, daſs ich dieſe Schrift zuerſt digitaliſiert habe. Eigentlich ſollte es wohl machbar ſein, die feinere, leichtere und klaſſiſchere Schrift von Yannis Haralambous auch ins Unifraktur-Projekt zu übernehmen. „Unifraktur Yfont“? In der nächſten Zeit reicht es mir dazu aber kaum, zumal ich mich mit der Konverſion zwiſchen verſchiedenen Font-Formaten nicht auskenne.
Benutzeravatar
mach
Site Admin
 
Beiträge: 394
Regiſtriert: 2010-07-16, 12:32
Wohnort: Üechtland

Re: Vorſtellungsrunde

Beitragvon wollmers » 2015-11-07, 17:32

Als jemand, der dieses Forum erst spät entdeckt hat, stell ich mich auch mal vor.

Mein Name ist Helmut Wollmersdorfer und ich verwende überall meinen Realnamen, bzw. die 8-stellige Abkürzung wollmers.

Beruflich bin ich in der IT beschäftigt.

In der Freizeit sammle ich Namen von Tieren, Pflanzen und anderen Lebewesen in möglichst vielen Sprachen. Entstanden ist das daraus, dass ich meine Naturfotos in mehreren Sprachen beschriften wollte. Da hatte ich dann begonnen, mal Namen aus Büchern in Excel-Tabellen zu erfassen (so um 1995 herum auf einem 386er Laptop). In der Mitte des ersten Schmetterlingsbuches war mir die Tipperei dann zu mühsam.

Also gleich elektronisch sammeln. Zumindest Copy & Paste, bzw. alle möglichen ad hoc geschriebenen Extraktionsskripte. Aber eigentlich sollte ein Computer so was auch selber schaffen, wenn ein Mensch das schafft. Womit ich bei approximativem, simultanem Parsen gelandet bin.

Irgendwie ist mir auch aufgefallen, dass viele Namen in der Luft hängen und keine Verknüpfung auffindbar ist. Die sind verwaist, haben den Anschluss verloren. Da wollte ich z. B. wissen, welcher Vogel sich hinter einem irgendwo gefundenen Namen verbirgt. Fündig wurde ich über Google in zwei uralten Büchern aus den Frühzeiten des Buchdrucks. Da lagern also ungehobene Schätze an Wissen in den Archiven.

Dank zunehmender Digitalisierung alter Bücher wird einiges davon greifbar. D. h. die Scans der Bücher sind vorhanden, leider ist das OCR-Resultat überwiegend mangelhaft. So ist die Indizierung der wissenschaftlichen Namen in der BHL (Biodiversity Heritage Library, http://www.biodiversitylibrary.org/) so mangelhaft, dass nur ca. 30 Prozent erkannt werden. Bei deutschsprachiger Literatur und allem anderen in Fraktur schaut es dann ganz schlecht aus. Der Großteil der deutschsprachigen Literatur ist nun mal in Fraktur geschrieben.

Weil ich nicht hinnehmen will, dass das so ist, hab ich mir zum Ziel gesetzt, die Qualität in diesem Bereich anzuheben.

Ähnliche Projekte gibt es auf den Gebieten von Geschichte, Zeitschriften, Literatur und bei klassischen Sprachen (Latein, Altgriechisch).

Selber konzentriere ich mich erstmal auf die Werke des deutschsprachigen Gebietes, bzw. sprachlich auf Deutsch, Englisch und Latein.

Helmut Wollmersdorfer
wollmers
 
Beiträge: 12
Regiſtriert: 2015-11-04, 10:33

Vorherige

Zurück zu Über das Forum

cron