Путь к текущей странице:

HTML-парсер на чистом JavaScript

2008-05-06

Автор небезызвестной JavaScript-библиотеки jQuery Джон Резиг взял да и написал HTML-парсер на чистом JavaScript.

Обработка всех возможных ошибок HTML не заявляется, однако в большинстве случаев библиотека даёт на выходе вполне корректный XHTML, отлично справляясь с наиболее частыми и очевидными из них, например:

отсутствие закрывающих тегов:
<p><b>Hello → <p><b>Hello</b></p>
отсутствие закрывающего слэша в «самозакрывающихся» элементах:
<img src=test.jpg> → <img src="test.jpg"/>
незакрытый строчный элемент перед блочным:
<b>Hello <p>John → <b>Hello </b><p>John</p>
отсутствие закрывающих тегов у элементов, для которых это допустимо в HTML4:
<p>Hello<p>World → <p>Hello</p><p>World</p>
атрибуты без значений (флаги):
<input disabled> → <input disabled="disabled"/>
ошибочный порядок закрывающих тегов вложенных элементов:
<b><i>example</b></i> → <b><i>example</i></b>

Попробовать библиотечку в действии можно на соответствующей демо-странице.

Размер js-файла без сжатия — чуть более 8 КБ.


Комментарии
S-Nors 2008-06-08

jQuery - 8 kb?

MT 2008-06-08

S-Nors:
HTML-парсер — отдельный продукт, на настоящий момент связанный с jQuery только именем автора.


Ваш комментарий

Вставка переводов строк и разбиение на абзацы происходит автоматически. HTML и BBCode не поддерживаются.

(не публикуется)
(спам бесполезен)
→ 
(можно будет отписаться)

© 2001—2008 Марат Таналин (http://TANALIN.com/)

Перепечатка любых материалов сайта в любом объёме запрещена


Статистика
  • Рейтинг@Mail.ru
  • Rambler's Top100