js search ideas based on elasticlunr.js - never going to be used, only here as a commit for future reference, if I ever need to revisit the idea of executing JS from python

2018-07-22 08:48:47 +01:00 · 2018-07-22 08:48:47 +01:00 · e16a7e3dea
commit e16a7e3dea
parent 487dab201e
2 changed files with 2561 additions and 2 deletions
--- a/elasticlunr.js
+++ b/elasticlunr.js
--- a/nasg.py
+++ b/nasg.py
@ -14,6 +14,7 @@ import re
 import imghdr
 import logging
 import asyncio
 import json
 from shutil import copy2 as cp
 from math import ceil
 from urllib.parse import urlparse
@ -27,10 +28,10 @@ import markdown
 from feedgen.feed import FeedGenerator
 from bleach import clean
 from emoji import UNICODE_EMOJI
 from py_mini_racer import py_mini_racer
 import exiftool
 import settings
 import sys
 from pprint import pprint
 MarkdownImage = namedtuple(
@ -65,7 +66,6 @@ MD = markdown.Markdown(
    ],
 )
 class MarkdownDoc(object):
    @property
    @cached()
@ -443,6 +443,18 @@ class Singular(MarkdownDoc):
        else:
            return True
    @property
    def corpus(self):
        return {
            'url': self.url,
            'title': self.title,
            'body': "\n".join([
                self.name,
                self.summary,
                self.content,
            ])
        }
    async def render(self):
        if self.exists:
            return
@ -1025,6 +1037,40 @@ class Category(dict):
        self.ping_websub()
 class Search(object):
    def __init__(self):
        self.js = py_mini_racer.MiniRacer()
        with open('elasticlunr.js') as f:
            self.js.eval(f.read())
        self.js.eval("""
            var index = elasticlunr();
            index.addField('title');
            index.addField('body');
            index.setRef('url');
        """)
        # index.saveDocument(false);
    @property
    def fpath(self):
        return os.path.join(
            settings.paths.get('build'),
            'search.json'
        )
    def add(self, data):
        self.js.eval("""
            index.addDoc(%s);
        """ % (
            json.dumps(data)
        ))
    def save(self):
        with open(self.fpath, 'wt') as f:
            f.write(json.dumps(self.js.eval("index.toJSON()")))
 def make():
    start = int(round(time.time() * 1000))
    content = settings.paths.get('content')
@ -1044,6 +1090,8 @@ def make():
    categories = {}
    categories['/'] = Category()
    sitemap = OrderedDict()
    search = Search()
    for e in sorted(glob.glob(os.path.join(content, '*', '*', 'index.md'))):
        post = Singular(e)
        if post.category not in categories:
@ -1056,6 +1104,7 @@ def make():
        for i in post.images.values():
            worker.append(i.downsize())
        worker.append(post.render())
        search.add(post.corpus)
        sitemap[post.url] = post.mtime
    for category in categories.values():
@ -1079,6 +1128,9 @@ def make():
    with open(t, 'wt') as f:
        f.write("\n".join(sorted(sitemap.keys())))
    # dump search index
    search.save()
    end = int(round(time.time() * 1000))
    logging.info('process took %d ms' % (end - start))