UK – przez pomyłkę „zgubiono” ~16 000 przypadków pozytywnego wyniku testów na COVID-19. Powód? Ograniczenie Excela…

05 października 2020, 19:31 | W biegu | komentarzy 8
: oglądaj sekurakowe live-streamy o bezpieczeństwie IT.

BBC donosi:

W przedziale 25. września – 2. października nie zaraportowano 15,841 wykrytych przypadków COVID-19.

Public Health England said 15,841 cases between 25 September and 2 October were left out of the UK daily case figures.
(…) The technical issue meant the daily case totals reported on the government’s coronavirus dashboard over the past week have been lower than the true number.

Jako powód podano „IT glitch” i dość enigmatycznie dodano, że same zarażone osoby zostały powiadomione, choć osoby z którymi się kontaktowały – już nie – zapewne tutaj chodzi o osoby korzystające z technologii contact tracing.

Czy był ów nietypowy „glicz”? Okazuje się, że brytyjska służba zdrowia (PHE) wpisuje dane pochodzące od zewnętrznych firm, z którymi współpracuje – do Microsoft Excela. Dokładniej, dane są zapisywane w nieco starszym formacie XLS, który posiada pewne ograniczenia – w szczególności maksymalna liczba wierszy to: 65536. Nowe wersje Excela umożliwiają wpisanie większej liczby wierszy, ale po zapisaniu całości do XLS (nie XLSX) – „nadmiarowe” wiersze są obcinane.

The problem is that the PHE developers picked an old file format to do this – known as XLS. As a consequence, each template could handle only about 65,000 rows of data rather than the one million-plus rows that Excel is actually capable of. And since each test result created several rows of data, in practice it meant that each template was limited to about 1,400 cases. When that total was reached, further cases were simply left off.

XLS

Istotny jest też fakt, że na każdy test składa się kilka wierszy, więc BBC informuje, że realny limit wynosił około 1400 przypadków

And since each test result created several rows of data, in practice it meant that each template was limited to about 1,400 cases. When that total was reached, further cases were simply left off.

Sam XLS jest jednym z kroków pośrednich całego dużego automatycznego procesu – na razie żeby zbytnio nie mieszać brytyjska służba zdrowia dzieli te pliki na nieco mniejsze – docelowo ma być jednak użyte nieco bardziej zaawansowane rozwiązanie…

–ms

Spodobał Ci się wpis? Podziel się nim ze znajomymi:



Komentarze

  1. Cyber Killer

    Z durniami nie wygrasz, zamiast zarequestować o prawdziwą bazę danych do pracy, to wolą wpisywać do arkusza kalkulacyjnego. Pewnie z kilkadziesiąt GB ramu zjada ten arkusz po załadowaniu :-/.

    Odpowiedz
    • :P

      Hahaha dobre.

      W perspektywie pandemii masz jak najszybciej zacząć zbierać i łączyć dane z niezależnych laboratoriów, które są w stanie wykonywać testy. Każe z nich ma własny system(o ile w ogóle ma), a do tego pewnie był zakupiony dawno temu wraz ze sprzętem i nie ma żadnego wsparcia.

      Propozycja łączenia przez bazę danych jest absurdalna. Odwlekła by rozwiązanie o kilka miesięcy i wyeliminowała z niego znaczną część laboratoriów(pewnie wszystkie małe i część średnich).

      Zasadniczo zostają w takim wypadku aż dwa wyjścia:
      -plik tekstowy, gdzie można być pewnym że użytkownikom format się rozjedzie albo nie będą wiedzieli jak do niego wyeksportować.
      -Excel jako najszybszy w implementacji i najbardziej znany

      Excel wydaje się tu jedynym sensownym rozwiązaniem. Pozostaje kwestia wyboru starego formatu, ale możliwe że to zostało pochopnie zmienione na prośbę laboratoriów działających na wersjach office 2000 w dół(bo kiedyś było kupione i nadal działa). Możliwe tez że jakiemuś developerowi domyślnie tak się zrzut z DB wyeksportował i tak zostało. Możliwe ze format łatwo by było zmienić, ale zważywszy na wagę systemu i presje czasu w jakiej był budowany nikt pewnie nie chce ryzykować. Ciężko ocenić czego używają i jak dalej procesują pliki, ale to ze używają excela tu jest rozwiązaniem oczywistym… no chyba że ktoś woli panią laborantkę logująca się do phpmyadmina i robiącego inserta do DB.

      Odpowiedz
    • sylwek

      oho wielki Pan informatyk…takie są realia, że na wielu komputerach jest jeszcze zainstalowany windows 98 albo xp

      Odpowiedz
  2. :)

    Warto by dodać że ten nieco starszy format został zastąpiony w 2003 roku, więc raczej już nikt starego nie powinien używać.

    Odpowiedz
    • niby nie powinien – ale może używali jakiegoś API po drodze, któremu łatwiej było „trawić” zwykły xls? :/

      Odpowiedz
  3. Uk

    Taaaa milion od razu 😂😂 ja pracuję z tego typu danymi i nie ma problemu jak ktoś potrafi obsługiwać Excel.

    Odpowiedz
  4. Radek

    Kto nie ma „Pakiet biurowy Microsoft Excel – level uber master” w CV niech pierwszy rzuci klawiaturą.

    Odpowiedz
  5. Tomasz21

    No to mieliśmy szczęście; dzięki temu uniknęliśmy pandemii. Niski stan zachorowalności. Można się tylko cieszyć. Bo inaczej, by nas przeczołgali.
    Pozdrawiam.

    Odpowiedz

Odpowiedz