endoflife-date-release-data/src/eks.py

import datetime
import re
from bs4 import BeautifulSoup
from common import endoflife
from datetime import datetime

# Now that AWS no longer publishes docs on GitHub,
# we use the Web Archive to still get the older versions
# Keep older pages at top of the list
URLS = [
    # 1.19.eks.1
    "https://web.archive.org/web/20221007150452id_/https://docs.aws.amazon.com/eks/latest/userguide/platform-versions.html",
    # + 1.20
    "https://web.archive.org/web/20230521061347id_/https://docs.aws.amazon.com/eks/latest/userguide/platform-versions.html",
    # + latest
    "https://docs.aws.amazon.com/eks/latest/userguide/platform-versions.html",
]
REGEX = r"^(?P<major>\d+)\.(?P<minor>\d+)\.(?P<patch>\d+)$"


def parse_platforms_pages():
    all_versions = {}
    print("::group::eks")
    for url in URLS:
        response = endoflife.fetch_url(url)
        soup = BeautifulSoup(response, features="html5lib")
        for tr in soup.select("#main-col-body")[0].findAll("tr"):
            td = tr.find("td")
            if td and re.match(REGEX, td.text.strip()):
                data = tr.findAll("td")
                date = data[-1].text.strip()
                if len(date) > 0:
                    d = datetime.strptime(date, "%B %d, %Y").strftime("%Y-%m-%d")
                    k8s_version = ".".join(data[0].text.strip().split(".")[:-1])
                    eks_version = data[1].text.strip().replace(".", "-")
                    version = f"{k8s_version}-{eks_version}"
                    all_versions[version] = d
                    print(f"{version}: {d}")
    print("::endgroup::")
    return all_versions

versions = parse_platforms_pages()
endoflife.write_releases('eks', versions)