[mangazuki] extract manga metadata

2017-09-22 20:53:43 +02:00
parent 543ba245eb
commit 9196005a4d
1 changed files with 24 additions and 9 deletions
--- a/gallery_dl/extractor/mangazuki.py
+++ b/gallery_dl/extractor/mangazuki.py
@@ -73,27 +73,42 @@ class MangazukiChapterExtractor(Extractor):
 class MangazukiMangaExtractor(MangaExtractor):
    """Extractor for manga from mangazuki.co"""
    category = "mangazuki"
-    pattern = [r"(?:https?://)?((?:raws\.)?mangazuki\.co/series/[^/?&#]+)"]
+    pattern = [r"(?:https?://)?((raws\.)?mangazuki\.co/series/[^/?&#]+)"]
    scheme = "https"
    test = [
        ("https://mangazuki.co/series/Double-Casting", {
            "url": "aab747414191b14e768f4a1eb148448d83ef2e14",
            "keyword": "99e64728381e110379703ef28511b45c1c850f86",
        }),
-        ("https://raws.mangazuki.co/series/Rakujitsu-no-Pathos", {
+        ("https://raws.mangazuki.co/series/Hyulla-s-Clan", {
-            "url": "0b85292b096909e8419632f35d3e2680d468c12c",
+            "url": "56ab020798c7a7b5b717166fe999455801a84f25",
            "keyword": "9067b2f614d45f399240a93cb9a187ccb25ebde2",
        }),
    ]
    def __init__(self, match):
        MangaExtractor.__init__(self, match)
        self.lang = "" if match.group(2) else "en"
    def chapters(self, page):
        params = {"page": 1}
-        chlist = []
+        results = []
        manga = text.extract(
            page, '<meta property="og:title" content="', '"')[0]
        data = {
            "manga": manga, "lang": self.lang,
            "language": util.code_to_language(self.lang, self.lang)
        }
        while True:
-            chlist.extend(
+            urls = text.extract_iter(page, '<li class="media"><a href="', '"')
-                text.extract_iter(page, '<li class="media"><a href="', '"'))
+            for url in urls:
                chapter = url.rpartition("/")[2]
                chapter, dot, minor = chapter.partition(".")
                data["chapter"] = int(chapter)
                data["chapter_minor"] = dot + minor
                results.append((url, data.copy()))
            if 'class="next disabled"' in page:
-                break
+                return results
            params["page"] += 1
            page = self.request(self.url, params=params).text
        return chlist