Парсинг HTML

Спарсить HTML можно через библиотеку phpQuery.

Ссылка на библиотеку: code.google.com/archive/p/phpquery/

Элементы выбираются на основе синтаксиса библиотеки jQuery.

include 'phpQuery/phpQuery.php';

$content = file_get_contents('https://ru.wikipedia.org/wiki/PHP');
phpQuery::newDocument($content);

// выборка <title>
pq('title')->text(); // PHP — Википедия

// выборка <meta name="generator">
pq('meta[name="generator"]')->attr('content'); // MediaWiki 1.31.0-wmf.15

// выборка элемента по атрибуту "id"
pq('#firstHeading')->text(); // PHP

// выборка ссылки на картинку PHP
pq('.wikidata-claim img')->attr('src'); // upload.wikimedia.org/...149px-PHP-logo.svg.png

// выборка и вывод нескольких элементов
foreach (pq('#p-lang li') as $lang) {
    echo pq($lang)->text();
}