Danke Dir.
Die Funktion ist mir schon bekannt, aber die Trennung wird eben auch auf professionellen Websites unterschiedlich gehandhabt. Dadurch, dass mehrere Wörter erlaubt sind, fällt Variante 1 schonmal weg, bleiben noch Variante 2 & 3. Liest der Crawler in Variante 3 nicht z.B. "{leerzeichen}bla", was ja einen anderen String ergeben würde als "bla". Oder sind die clever genug?
---
