Какой тип парсеров лучше использовать для разбора Javascript?

0

1

LR (LALR)? LL? Recursive descent? Что-то другое? Нужно, чтобы парсер получился как можно проще.

Я правильно понимаю: нельзя так просто взять и написать грамматику для yacc/bison из-за правила о вставке точки с запятой?

Ссылка

← Еще одно маленькое украшение в синтаксисе Rust

Можно ли с сервера через ajax передавать блоки html в json ? →

Готовые парсеры называются esprima и acorn. Тебе точно надо свой колбасить через генераторы? Если надо, то бизоноподобные я бы использовал только если пакратовскими описать нельзя. Вот для PEG https://github.com/pegjs/pegjs/blob/master/examples/javascript.pegjs, но если чо, мопед не мой.

Vit ★★★★★
(04.10.17 07:00:38 MSK)

Ответ на: комментарий от Vit 04.10.17 07:00:38 MSK

Готовые парсеры называются esprima и acorn.

Есть и другие, но они (почти?) все написаны на JS.

А мне скорости nodejs не хватает, хочу сделать на другом недоязычке.

kinkstarter
(04.10.17 07:10:14 MSK) автор топика

из-за правила о вставке точки с запятой?

Это Вы о чем? Переносы строк можно заменить на точки с запятой или наоборот, они равноценны, кроме некоторых случаев, которые описаны в документации, таких как например

foo()
(bar)

~~onceagain2017~~
(04.10.17 09:13:40 MSK)

Ответ на: комментарий от onceagain2017 04.10.17 09:13:40 MSK

Я про автоматическую вставку точки с запятой в конце строки, которую выполняют парсеры, если без точки с запятой код не распарсивается.

кроме некоторых случаев

Вот именно.

foo()
(bar)

А также

foo
.f()
.g()

И так далее. Тупо заменять нельзя.

kinkstarter
(04.10.17 09:22:46 MSK) автор топика

Ответ на: комментарий от kinkstarter 04.10.17 09:22:46 MSK

Ну, и что вам мешает делать то же самое?

~~onceagain2017~~
(04.10.17 09:23:48 MSK)

Ответ на: комментарий от onceagain2017 04.10.17 09:23:48 MSK

Я говорил про формальное описание грамматики для bison/yacc.

kinkstarter
(04.10.17 09:24:56 MSK) автор топика

Ответ на: комментарий от kinkstarter 04.10.17 07:10:14 MSK

acorn довольно быстрый, но хозяин барин. Думаю тебе точно никто не скажет, т.к. у большинства на других языках интерес был в лучшем случае подсветку синтаксиса сделать.

Vit ★★★★★
(04.10.17 14:24:17 MSK)

Ответ на: комментарий от kinkstarter 04.10.17 07:10:14 MSK

http://marijnhaverbeke.nl/parse-js/ http://marijnhaverbeke.nl/cl-javascript/

den73 ★★★★★
(04.10.17 14:39:51 MSK)

Ссылка

Ответ на: комментарий от Vit 04.10.17 14:24:17 MSK

У Фейсбука есть тайпчекер (ну и как следствие, парсер) на OCaml, Flow называется.

anonymous
(04.10.17 14:42:33 MSK)

Ссылка

тут http://hg.nginx.org/njs/file/tip/njs/njs_parser.c LL(2)

drsm ★★
(04.10.17 15:00:38 MSK)

Ответ на: комментарий от kinkstarter 04.10.17 09:24:56 MSK

Кстати, а можешь посоветовать хороший туториал, как описывать парсеры на bison/yacc и при этом не отстрелить себе ноги по шею? Я так и не смог объять разумом методику. В итоге скатился на peg, где все сверху вниз раскладывается одним единственным способом.

Vit ★★★★★
(04.10.17 15:14:32 MSK)

Ответ на: комментарий от kinkstarter 04.10.17 09:24:56 MSK

Формальное описание грамматики (BNF) есть прямо в стандарте:

https://www.ecma-international.org/publications/files/ECMA-ST/Ecma-262.pdf

Appendix A: Grammar Summary

Но сделать из него рабочую bison-грамматику скорее всего будет не очень просто. Нужно же будет откатываться при ошибке на токен назад, добавлять токен точки с запятой и пробовать парсить опять.

Хотя, может быть для этого есть какой-то простой трюк

Deleted
(04.10.17 15:36:47 MSK)

Ответ на: комментарий от Deleted 04.10.17 15:36:47 MSK

А зачем «описывать грамматику», если можно просто написать парсер?

~~onceagain2017~~
(04.10.17 19:07:18 MSK)

Ответ на: комментарий от onceagain2017 04.10.17 19:07:18 MSK

А зачем «описывать грамматику»

В стандарте? Да кто ж их знает. Но это хорошая, годная практика. Там же именно описание, почти в свободной форме.

если можно просто написать парсер?

Ну, скорее всего не так уж просто. Тем более с yacc/bison. Может быть получится обрабатывать автоматическую вставку точки с запятой с помощью восстановления после ошибок https://www.gnu.org/software/bison/manual/html_node/Error-Recovery.html

А может быть и нет

Deleted
(04.10.17 22:35:14 MSK)

Ссылка

Ответ на: комментарий от Vit 04.10.17 15:14:32 MSK

Нет, я тоже их недолюбливаю.

kinkstarter
(05.10.17 03:55:28 MSK) автор топика

Ссылка

Может быть, получится выдрать парсер из исходников node.js, если он не прибит гвоздями.

kinkstarter
(05.10.17 03:57:28 MSK) автор топика

Ответ на: комментарий от drsm 04.10.17 15:00:38 MSK

Интересно, спасибо.

kinkstarter
(05.10.17 03:58:41 MSK) автор топика

Ответ на: комментарий от kinkstarter 05.10.17 03:57:28 MSK

Наверное имелось в виду из v8, а не из ноды.

А точно acorn медленный? Он довольно грамотно оптимизирован. Есть какие-то критерии какая скорость нужна?

Vit ★★★★★
(05.10.17 05:32:11 MSK)