updated importer and evaluation functions

2026-01-08 04:00:05 +01:00 · 2019-01-16 14:53:11 +01:00
parent cbf2dc611d
commit e46527d248
12 changed files with 32520 additions and 32460 deletions
--- a/osaca/data/bdw_data.csv
+++ b/osaca/data/bdw_data.csv
--- a/osaca/data/hsw_data.csv
+++ b/osaca/data/hsw_data.csv
--- a/osaca/data/ivb_data.csv
+++ b/osaca/data/ivb_data.csv
--- a/osaca/data/model_importer.py
+++ b/osaca/data/model_importer.py
@@ -7,6 +7,7 @@ import argparse
 from distutils.version import StrictVersion

 from osaca.param import Parameter, Register
+from osaca.eu_sched import Scheduler


 def normalize_reg_name(reg_name):
@@ -18,18 +19,70 @@ def normalize_reg_name(reg_name):
    return reg_name


-def port_occupancy_from_tag_attributes(attrib):
+def port_occupancy_from_tag_attributes(attrib, arch):
    occupancy = defaultdict(int)
    for k, v in attrib.items():
-        if not k.startswith('port'):
+        m = re.match('^port([0-9]+)', k)
+        if not m:
            continue
-        potential_ports = list(k[4:])
+        ports = m.group(1)
+        # Ignore Port7 on HSW, BDW, SKL and SKX if present in combination with ports 2 and 3.
+        # Port7 is only used for simple address generation, while 2 and 3 handle all addressing,
+        # but uops.info does not differentiate.
+        if arch in ['HSW', 'BDW', 'SKL', 'SKX'] and ports == '237':
+            ports = ports.replace('7', '')
+        potential_ports = list(ports)
        per_port_occupancy = int(v) / len(potential_ports)
        for pp in potential_ports:
            occupancy[pp] += per_port_occupancy
+
+    # Also consider DIV pipeline
+    if 'div_cycles' in attrib:
+        occupancy['0DV'] = int(attrib['div_cycles'])
+
    return dict(occupancy)


+def extract_paramters(instruction_tag):
+    # Extract parameter components
+    parameters = []  # used to store string representations
+    parameter_tags = sorted(instruction_tag.findall("operand"),
+                            key=lambda p: int(p.attrib['idx']))
+    for parameter_tag in parameter_tags:
+        # Ignore parameters with suppressed=1
+        if int(parameter_tag.attrib.get('suppressed', '0')):
+            continue
+
+        p_type = parameter_tag.attrib['type']
+        if p_type == 'imm':
+            parameters.append('imd')  # Parameter('IMD')
+        elif p_type == 'mem':
+            parameters.append('mem')  # Parameter('MEM')
+        elif p_type == 'reg':
+            possible_regs = [normalize_reg_name(r)
+                             for r in parameter_tag.text.split(',')]
+            reg_groups = [Register.sizes.get(r, None) for r in possible_regs]
+            if reg_groups[1:] == reg_groups[:-1]:
+                if reg_groups[0] is None:
+                    raise ValueError("Unknown register type for {} with {}.".format(
+                        parameter_tag.attrib, parameter_tag.text))
+                elif reg_groups[0][1] == 'GPR':
+                    parameters.append('r{}'.format(reg_groups[0][0]))
+                    # Register(possible_regs[0]))
+                elif '{' in parameter_tag.text:
+                    # We have a mask
+                    parameters[-1] += '{opmask}'
+                else:
+                    parameters.append(reg_groups[0][1].lower())
+        elif p_type == 'relbr':
+            parameters.append('LBL')
+        elif p_type == 'agen':
+            parameters.append('mem')
+        else:
+            raise ValueError("Unknown paramter type {}".format(parameter_tag.attrib))
+    return parameters
+
+
 def extract_model(tree, arch):
    model_data = []
    for instruction_tag in tree.findall('//instruction'):
@@ -38,45 +91,10 @@ def extract_model(tree, arch):
        mnemonic = instruction_tag.attrib['asm']

        # Extract parameter components
-        parameters = []  # used to store string representations
-        parameter_tags = sorted(instruction_tag.findall("operand"),
-                                 key=lambda p: int(p.attrib['idx']))
-        for parameter_tag in parameter_tags:
-            # Ignore parameters with suppressed=1
-            if int(parameter_tag.attrib.get('suppressed', '0')):
-                continue
-
-            p_type = parameter_tag.attrib['type']
-            if p_type == 'imm':
-                parameters.append('imd')  # Parameter('IMD')
-            elif p_type == 'mem':
-                parameters.append('mem')  # Parameter('MEM')
-            elif p_type == 'reg':
-                possible_regs = [normalize_reg_name(r)
-                                 for r in parameter_tag.text.split(',')]
-                reg_groups = [Register.sizes.get(r, None) for r in possible_regs]
-                if reg_groups[1:] == reg_groups[:-1]:
-                    if reg_groups[0] is None:
-                        print('Unknown register type for', mnemonic, ':',
-                              parameter_tag.attrib, parameter_tag.text,
-                              file=sys.stderr)
-                        ignore = True
-                    elif reg_groups[0][1] == 'GPR':
-                        parameters.append('r{}'.format(reg_groups[0][0]))
-                        # Register(possible_regs[0]))
-                    elif '{' in parameter_tag.text:
-                        # We have a mask
-                        parameters[-1] += '{opmask}'
-                    else:
-                        parameters.append(reg_groups[0][1].lower())
-            elif p_type == 'relbr':
-                parameters.append('LBL')
-            elif p_type == 'agen':
-                parameters.append('mem')
-            else:
-                print("Unknown paramter type:", parameter_tag.attrib, file=sys.stderr)
-                ignore = True
-        if ignore: continue
+        try:
+            parameters = extract_paramters(instruction_tag)
+        except ValueError as e:
+            print(e, file=sys.stderr)

        # Extract port occupation, throughput and latency
        port_occupancy, throughput, latency = [], 0.0, None
@@ -85,7 +103,7 @@ def extract_model(tree, arch):
            continue
        # We collect all measurement and IACA information and compare them later
        for measurement_tag in arch_tag.iter('measurement'):
-            port_occupancy.append(port_occupancy_from_tag_attributes(measurement_tag.attrib))
+            port_occupancy.append(port_occupancy_from_tag_attributes(measurement_tag.attrib, arch))
            # FIXME handle min/max Latencies ('maxCycles' and 'minCycles')
            latencies = [int(l_tag.attrib['cycles'])
                         for l_tag in measurement_tag.iter('latency') if 'latency' in l_tag.attrib]
@@ -98,7 +116,7 @@ def extract_model(tree, arch):
        # Ordered by IACA version (newest last)
        for iaca_tag in sorted(arch_tag.iter('IACA'),
                               key=lambda i: StrictVersion(i.attrib['version'])):
-            port_occupancy.append(port_occupancy_from_tag_attributes(iaca_tag.attrib))
+            port_occupancy.append(port_occupancy_from_tag_attributes(iaca_tag.attrib, arch))
        if ignore: continue

        # Check if all are equal
@@ -119,11 +137,11 @@ def extract_model(tree, arch):
    return model_data


-def all_or_false(iter):
-    if not iter:
+def all_or_false(iterator):
+    if not iterator:
        return False
    else:
-        return all(iter)
+        return all(iterator)


 def build_variants(mnemonic, parameters):
@@ -151,12 +169,25 @@ def architectures(tree):
    return set([a.attrib['name'] for a in tree.findall('.//architecture')])


-def dump_csv(model_data):
+def int_or_zero(s):
+    try:
+        return int(s)
+    except ValueError:
+        return 0
+
+
+def dump_csv(model_data, arch):
    csv = 'instr,TP,LT,ports\n'
    ports = set()
    for mnemonic, throughput, latency, port_occupancy in model_data:
        for p in port_occupancy:
            ports.add(p)
+    ports = sorted(ports)
+    # If not all ports have been used (happens with port7 due to blacklist
+    # port_occupancy_from_tag_attributes), extend list accordingly:
+    while len(ports) < Scheduler.arch_dict[arch] + len(Scheduler.arch_pipeline_ports.get(arch, [])):
+        max_index = ports.index(str(max(map(int_or_zero, ports))))
+        ports.insert(max_index + 1, str(max(map(int_or_zero, ports)) + 1))

    for mnemonic, throughput, latency, port_occupancy in model_data:
        for p in ports:
@@ -180,12 +211,12 @@ def main():
    tree = ET.parse(args.xml)
    if args.arch:
        model_data = extract_model(tree, args.arch)
-        print(dump_csv(model_data))
+        print(dump_csv(model_data, args.arch))
    else:
        for arch in architectures(tree):
            model_data = extract_model(tree, arch)
            with open('{}_data.csv'.format(arch), 'w') as f:
-                f.write(dump_csv(model_data))
+                f.write(dump_csv(model_data, arch))


 if __name__ == '__main__':
--- a/osaca/data/nhm_data.csv
+++ b/osaca/data/nhm_data.csv
--- a/osaca/data/skl_data.csv
+++ b/osaca/data/skl_data.csv
--- a/osaca/data/skx_data.csv
+++ b/osaca/data/skx_data.csv
--- a/osaca/data/snb_data.csv
+++ b/osaca/data/snb_data.csv
--- a/osaca/data/wsm_data.csv
+++ b/osaca/data/wsm_data.csv
--- a/osaca/eu_sched.py
+++ b/osaca/eu_sched.py
@@ -12,8 +12,23 @@ from osaca.param import Register, MemAddr


 class Scheduler(object):
-    arch_dict = {'SNB': 6, 'IVB': 6, 'HSW': 8, 'BDW': 8, 'SKL': 8, 'SKX': 8, 'ZEN': 10}
-    dv_ports_dict = {'ZEN': [3]}  # FIXME 'SKL': [0], 'SKX': [0] disabled due to uops.info export
+    arch_dict = {
+        # Intel
+        'NHM': 5, 'WSM': 5,  # Nehalem, Westmere
+        'SNB': 6, 'IVB': 6,  # Sandy Bridge, Ivy Bridge
+        'HSW': 8, 'BDW': 8,  # Haswell, Broadwell
+        'SKL': 8, 'SKX': 8,  # Skylake(-X)
+        'KBL': 8, 'CFL': 8,  # Kaby Lake, Coffee Lake
+        # AMD
+        'ZEN': 10,  # Zen/Ryzen/EPYC
+    }
+    arch_pipeline_ports = {
+        'NHM': ['0DV'], 'WSM': ['0DV'],
+        'SNB': ['0DV'], 'IVB': ['0DV'],
+        'HSW': ['0DV'], 'BDW': ['0DV'],
+        'SKL': ['0DV'], 'SKX': ['0DV'],
+        'KBL': ['0DV'], 'CFL': ['0DV'],
+        'ZEN': ['0DV'],}
    # content of most inner list in instrList: instr, operand(s), instr form
    df = None  # type: DataFrame
    # for parallel ld/st in archs with 1 st/cy and >1 ld/cy, able to do 1 st and 1 ld in 1cy
@@ -33,7 +48,7 @@ class Scheduler(object):
            self.en_par_ldst = True
            self.ld_ports = [9, 10]
        # check for DV port
-        self.dv_ports = self.dv_ports_dict.get(arch, [])
+        self.pipeline_ports = self.arch_pipeline_ports.get(arch, [])
        self.instrList = instruction_list
        # curr_dir = os.path.realpath(__file__)[:-11]
        osaca_dir = os.path.expanduser('~/.osaca/')
@@ -60,8 +75,8 @@ class Scheduler(object):
        sched = self.get_head()
        # Initialize ports
        # Add DV port, if it is existing
-        occ_ports = [[0] * (self.ports + len(self.dv_ports)) for x in range(len(self.instrList))]
-        port_bndgs = [0] * (self.ports + len(self.dv_ports))
+        occ_ports = [[0] * (self.ports + len(self.pipeline_ports)) for x in range(len(self.instrList))]
+        port_bndgs = [0] * (self.ports + len(self.pipeline_ports))
        # Store instruction counter for parallel ld/st
        par_ldst = 0
        # Count the number of store instr if we schedule for an architecture with par ld/st
@@ -361,14 +376,7 @@ class Scheduler(object):

        :return: list of strings
        """
-        port_names = []
-        dv_ports_appended = 0
-        for i in range(self.ports):
-            port_names.append(str(i))
-            if i in self.dv_ports:
-                dv_ports_appended += 1
-                port_names.append(str(i)+'DV')
-        return port_names
+        return sorted([str(i) for i in range(self.ports)] + self.pipeline_ports)

    def get_port_binding(self, port_bndg):
        """
--- a/tests/test_osaca.py
+++ b/tests/test_osaca.py
@@ -48,7 +48,7 @@ class TestOsaca(unittest.TestCase):

    #@unittest.skip("Skip until required instructions are supported.")
    def test_asm_API(self):
-        with open(self.curr_dir + '/testfiles/3d-7pt.iaca_marked.s') as f:
+        with open(self.curr_dir + '/testfiles/3d-7pt.icc.skx.avx512.iaca_marked.s') as f:
            osa = osaca.OSACA('SKX', f.read())

        text_output = osa.create_output()
--- a/tests/testfiles/3d-7pt.icc.skx.avx512.iaca_marked.s
+++ b/tests/testfiles/3d-7pt.icc.skx.avx512.iaca_marked.s