•  
  • Archives for PHP (4)

Neuer Parser für Webkit

Categories: News
Comments: Comments Off
Published on: 06/08/2010

Die Entwickler der freien Browser-Engine Webkit haben in den letzten Monaten einen neuen Parser geschrieben und in Webkit integriert. Dieser soll vor allem die Kompatibilität mit anderen Browsern verbessern.

Der neue Webkit-Parser basiert auf dem mit HTML5 spezifizierten Parser-Algorithmus, denn mit der neuen HTML-Generation soll auch festgelegt werden, wie ein Browser HTML-Dokumente zu verarbeiten hat. Bislang geht jeder Browser auf seine eigene Art und Weise mit ungültigem HTML um, was der Interoperabilität nicht sehr zuträglich ist.

Das soll sich mit HTML5 ändern. Dazu wird erstmals ein kompletter Parser-Algorithmus festgelegt, um für eine bessere Interoperabilität zwischen verschiedenen Browsern zu sorgen. Alle Browser, die den mit HTML5 spezifizierten Parser implementieren, sollen HTML in gleicher Art und Weise verarbeiten, so dass Webseiten in allen Browsern gleich aussehen, auch wenn die Dokumente ungültiges HTML enthalten.

Zudem soll der neue Parser die Kompatibilität mit real existierenden Webseiten verbessern, denn der Spezifikation des Algorithmus gingen umfangreiche Analysen voraus, um den Algorithmus möglichst gut auszubalancieren. Daneben erlaubt es der Ansatz, SVG und MathML in HTML einzubetten. So wird eine Vektorgrafik in SVG einfach mit einem <svg>-tag eingeleitet.

Wer seine Webseiten bislang auf die Eigenheiten von Webkit optimiert hat, wird diese mit dem Umstieg auf den neuen Parser aber gegebenenfalls anpassen müssen, denn zugunsten einer möglichst hohen Kompatibilität mit anderen HTML5-Browsern machen die Webkit-Entwickler Abstriche bei der Abwärtskompatibilität. Allerdings betrifft das ausschließlich HTML-Konstrukte, die bislang nur von Webkit verarbeitet wurden.

Webkits HTML5-Parser steht im Kern und umfasst derzeit rund 10.000 Codezeilen. Er kann mit aktuellen Nightly-Builds von Webkit ausprobiert werden. Allerdings fehlt noch ein nennenswerter Teil: Fragment-Parsing, wie es von innerHTML und HTML5test.com verwendet wird. Hier kommt der aktuelle Nightly-Build von Webkit im Übrigen auf 222 von 300 Punkten, zuzüglich sieben Bonuspunkten. Safari 5.0.1 erreicht 208 Punkte plus sieben Bonuspunkte.

Zusammen mit dem HTML5-Parser hat das Webkit-Team auch 250 Tests entwickelt, die dem W3C für dessen Parser-Testsuite HTML5lib zur Verfügung gestellt werden.

Mozilla arbeitet ebenfalls an einer Implementierung des HTML5-Parsers für Firefox 4.0. Das Projekt html5lib arbeitet seinerseits an einer freien Implementierung des HTML5-Parsers in Python und PHP.

Aktuelle Nightly-Builds von Webkit stehen unter nightly.webkit.org für Windows und Mac OS X zum Download bereit.

Flash-Captchas gegen Spambots

Categories: News
Comments: Comments Off
Published on: 02/07/2010

Animierte Captchas sollen die gute Lesbarkeit für den Menschen erhalten, Spambots und automatische Skripte dennoch draußenhalten. “Completely Automated Public Turing tests to tell Computers and Humans Apart” (CAPTCHAs) soll von Spammern und anderen Kriminellen benutzte Tools unwirksam machen, die automatische Tätigkeiten wie das Anlegen von Konten in Foren und bei Maildiensten erledigen.

Der Anbieter NuCaptcha versucht dies durch animierte Captchas zu erreichen. Grundsätzlich sind animierte Captchas zwar nicht neu, bislang bestand die Animation jedoch meist darin, eine Zeichenfolge etwa durch einen springenden Ball oder andere Maßnahmen teilweise zu verdecken oder sich bewegende Gitterlinien einzublenden.

NuCaptcha geht einen anderen Weg und animiert die Zeichenfolge, vor einem sich ebenfalls bewegenden Hintergrund nebst anderer Elemente in einem Flash-Video. Damit muss die zu erkennende Zeichenfolge nach Meinung der Entwickler nicht mehr so stark verzerrt werden, sodass die Erkennung für den Menschen leichter fällt, Bots aufgrund zu vieler Kanten im Bild trotzdem Probleme mit der Erkennung haben. Gerade zu stark verschwurbelte Captchas halten oft mehr Anwender als Bots von einer erfolgreichen Anmeldung ab.

Die Schrift scrollt, der Ball dreht sich, die Fahne flattert – eine schwere Aufgabe für Spambots.

Ob NuCaptcha mit seinem Ansatz Erfolg haben wird, muss sich zeigen. In den aktuellen Demos ist die zu erkennende Zeichenfolge immer rot eingefärbt. Mit Filtern ließen sich alle anderen Elemente ausblenden, um die anschließende OCR-Erkennung zu vereinfachen. Mit mehreren aufeinanderfolgenden Screenshots ließe sich schließlich der richtige Bereich ausmachen.

NuCaptcha verspricht auch, die mittlerweile gesichteten Captcha-Breaking-Dienstleister, bei denen Menschen für Spammer Zerrbilder am Fließband identifizieren, ausbremsen zu können. Mit speziellen Algorithmen will man in der Lage sein, zu erkennen, ob essich um Antworten von einem menschlichem Dienstleister handelt und gegebenenfalls die Animation verlangsamen. Professionelle Captcha-Breaker sollen im Schnitt 4 Sekunden für die Erkennung benötigen. NuCaptcha soll das auf 15 Sekunden hinauszögern können, sodass es unrentabel werden soll.
NuCaptcha ist bislang als kostenloser Dienst verfügbar, der sich über ein API in eigene PHP- und .Net-Anwendungen einbinden lässt.

Für WordPress steht sogar schon ein eigenes Plug-in bereit. NuCaptcha setzt zwar auf Flash, soll aber auch auf Plattformen laufen – dort dann über animierte GIFs und JavaScript.

Quelle: www.heise.de

page 1 of 2»

Welcome , today is Monday, 06/02/2012