extract_entries.py
images/
json/
msword/
pdf/