Excire Forum
Duplikatesuche mit zweifelhaftem Ergebnis - Druckversion

+- Excire Forum (https://forum.excire.com)
+-- Forum: Deutsche Community (https://forum.excire.com/forumdisplay.php?fid=3)
+--- Forum: Excire Search (https://forum.excire.com/forumdisplay.php?fid=16)
+---- Forum: Funktionsweise und Benutzung von Excire Search (https://forum.excire.com/forumdisplay.php?fid=5)
+---- Thema: Duplikatesuche mit zweifelhaftem Ergebnis (/showthread.php?tid=1711)



Duplikatesuche mit zweifelhaftem Ergebnis - photopoeth - 26.01.2023

Ich wollte die Testversion der Dublettensuche ausprobieren. Leider werden in der Testphase immer nur 3 (!) Ergebnisse angezeigt. Insofern ist ein Test nicht wirklich möglich. Also habe ich heute das Upgrade durchgeführt und losgelegt. Und siehe da, gleich die zweite Ergebnissammlung (die leider im Test nie gezeigt wurde) lieferte ein äußerst seltsames Ergebnis.

Ich hatte "Beinahe-Duplikate" - "Strikt" - "Genaueren Algorithmus verwenden" ausgewählt. Die erwähnte Ergebnissammlung enthält Zeitrafferaufnahmen einer sich entfaltenden Pusteblume. Im entsprechenden Ordner befinden sich 808 Bilder, gefunden wurden nur 626. Meine Vermutung war nun, dass ich ja "streng" gewählt hatte und somit die letzten Bilder (wenn die Blüte noch offen ist) sicher durch das Raster fallen würden. Aber weit gefehlt! Die nicht erkannten Bilder sind kreuz und quer über die Reihe verteilt.
Zur Verdeutlichung habe ich die erkannten Bilder im Ordner GRÜN und die nicht erkannten Bilder ROT markiert. Hier ein Screenshot der Rasteransicht:

[Bild: i1zu4Hz.png]

Ich bin sehr erstaunt (und auch ein wenig enttäuscht). Natürlich ist das in diesem konkreten Fall kein größeres Problem, da sich alle Bilder im selben Ordner befinden. Aber was ist, wenn in anderen Fällen die Bilder in verschiedenen Ordnern liegen und dann nicht im Ergebnis auftauchen? Dann hilft mir der Dublettenfinder nicht wirklich weiter. Das ist etwas ärgerlich, da ich das aufgrund der sehr eingeschränkten Testmöglichkeiten im Vorfeld nicht herausfinden konnte.   Sad

Um es klar zu sagen: Es geht mir nicht um die 29€. Vielmehr wollte ich für mich klären, ob es sich lohnt, die _Zeit_ zu investieren, um den Katalog gründlich aufzuräumen. Das obige Ergebnis lässt mich daran stark zweifeln. Ich befürchte, dass ich viel Zeit vergeude und am Ende noch viele unerkannte Dubletten übrig bleiben. Und natürlich ist mir klar, dass die Ergebnisse nicht perfekt sein können und eine gewisse Dunkelziffer bleibt, aber wenn bei solch sehr eindeutigen Bildern die Trefferquote schon schlecht ist, will ich mir nicht ausmalen, wie es in komplexeren Fällen aussieht. 

Daher die Frage: Wie lässt sich dieses als erratisch zu bezeichnende Ergebnis erklären?


RE: Duplikatesuche mit zweifelhaftem Ergebnis - photopoeth - 27.01.2023

Excire hat mich heute zu diesem Thema sowie zu meinem Vorschlag, Bilder von der Duplikatesuche auszuschließen, kontaktiert (mehr zu letzterem hier: https://bityl.co/Gs9m).

Zu diesem Thema:
Die Sache erklärt sich durch Performance-Optimierung, also den Tradeoff zwischen Genauigkeit und Geschwindigkeit. Eine gewisse Unschärfe wird dabei in Kauf genommen, um die Zeiten für die Ermittlung der Dubletten in Grenzen zu halten. Da die Suche bei mir fast einen halben Tag gedauert hat, ist es so gesehen eine gute Idee.
In diesem Fall ist diese Ungenauigkeit nicht wirklich dramatisch, da die Bilder alle im selben Verzeichnis liegen und somit auch von mir erfasst werden. Hier geht also nichts verloren.

Anders sieht es aus, wenn die Duplikate weiter im Dateisystem verteilt wären. Dann könnte es tatsächlich passieren, dass einige Duplikate durchrutschen.
Auf der anderen Seite erkauft man sich diese höhere Genauigkeit mit einer schlechteren Performance und es wird wohl eher um einzelne Bilder und nicht ganze Bildreihen (wie hier) gehen.

Insofern lohnt sich die Dunkelziffer der unerkannten Duplikate bei genauerer Betrachtung. Lieber 98% des Bestandes bei guter Performance in Ordnung bringen, als 99,9%  - 100% werden es wohl nie Wink - bei miserabler Performance.

Also danke an Excire für die Aufklärung, da war meine Erwartungshaltung wohl zu optimistisch.


RE: Duplikatesuche mit zweifelhaftem Ergebnis - JKN - 27.01.2023

Wie ist es denn, wenn man einfach die Duplikatsuche nach dem ersten Durchgang einfach noch mal laufen lässt um die "restlichen" Duplikate zu finden?


RE: Duplikatesuche mit zweifelhaftem Ergebnis - photopoeth - 29.01.2023

Das ist eine gute Frage. Da die Suche bei mir doch recht lange läuft habe ich das nicht versucht und kann daher nur mutmaßen. Da eine KI nicht deterministisch ist, werden vermutlich andere Treffer fehlen (aus den genannten Performance-Gründen). Es könnte also sein, dass man wichtige fehlende bei mehrmaligen Durchläufen trifft (oder auch nicht).
Ich habe mich entschieden, dass ich mit der Unschärfe leben kann. Das ist kein wirklich großes Problem, wenn man darauf eingestellt wird. Alles was ich im Vorfeld gelesen hatte, führte zu einer übersteigerten Erwartungshaltung meinerseits. Vielleicht sollte Excire an der Stelle noch nachbessern, damit man mit realistischer Erwartungshaltung an die Sache rangeht. Oder aber es ging nur mir so... Wink


RE: Duplikatesuche mit zweifelhaftem Ergebnis - JKN - 30.01.2023

Ich bin auch davon ausgegangen, dass alle Duplikate gefunden werden und habe nicht damit gerechnet, dass es "vernachlässigte" Fotos gibt.
Bislang habe ich die Exakte Duplikate Suche in der ganzen Datenbank genutzt. Die dauert denke ich noch am längsten...


RE: Duplikatesuche mit zweifelhaftem Ergebnis - jasonadams - 02.04.2023

Aus meiner Erfahrung, es gibt nicht viele gute Online-Casinos.
Offenen Bewertungen zufolge hat sich Ice casino anmelden https://ice-casino.de/ schon seit langer Zeit behauptet.
Dort finden Sie die größte Anzahl an verschiedenen Spielen, von Tischspielen bis hin zu Spielautomaten.


RE: Duplikatesuche mit zweifelhaftem Ergebnis - denisraskov2 - 04.04.2023

В миналото съм губил безброй часове в търсене на надеждни онлайн казина с голям избор на игри и бонуси, само за да се окажа разочарован. Всичко това се промени, когато открих онлайн казино в българия . Този уебсайт предлага богата информация за различни онлайн казина, включително задълбочени ревюта и експертни съвети. Ангажиментът им да предоставят точна информация за мерките за безопасност също е безценен за осигуряването на сигурно игрално преживяване. Ако търсите надежден източник на информация за онлайн казината, няма да останете разочаровани от този уебсайт.


RE: Duplikatesuche mit zweifelhaftem Ergebnis - florencepugh - 26.04.2023

Es kann mehrere Gründe geben, warum einige der Bilder in Ihrem Ordner nicht als Duplikate erkannt wurden. Eine Möglichkeit besteht darin, dass der von der Software zum Vergleichen der Bilder verwendete Algorithmus möglicherweise bestimmte Ähnlichkeiten oder Unterschiede zwischen ihnen nicht erkennen konnte, was zu ungenauen Ergebnissen führt. Eine andere Möglichkeit besteht darin, dass es einige geringfügige Abweichungen in den Bildern gegeben haben könnte, z. B. Unterschiede in der Beleuchtung oder Komposition, die sie für den Algorithmus contexto anders erscheinen ließen.