Urban knight
But there’s no sense crying over every mistake. You just keep on trying till you run out of cake.
Таки, доброго дня.
Если коротко, то необходимо вытащить из статьи в википедии все ссылки. Чуток покопавшись, нашел API через который можно получить необходимую статью. В получаемой статье ссылки имеют вот такй заковыристый синтаксис
[[Мещанство|мещанина]]
Две скобки, название статьи, слово для читаемого вида, две скобки.
Чтоб вытащить названия статей пробовал использовать вот такое выражение
preg_match_all('/(?<=\[\[)([^\|])+(?=(\|)?.*(\]\]))/', $input, $matches);

Как я это вижу:
начинается с двух скобок
текст, не содержащий вертикальную палку, один или более символов
заканчиваетсяя всё на вертикальную палку одну или ноль, рандомные символы и две закрывающие скобки

Если брать текст, про Ленина, то не правильно уже с второго результата =(

Ссылка на статью, про Ленина через API
ru.wikipedia.org/w/api.php?format=xml&action=qu...

@темы: PHP