मुझे लगता है कि डेटा के थोड़ा सुधार करने से कोई बचा नहीं है, और इसके लिए आप एक अस्थायी तालिका का उपयोग कर सकते हैं।
नोट :मैंने सभी समय प्रारूप गणनाओं से बचने के लिए स्रोत डेटा के रूप में समय के बजाय पूर्णांक के साथ एक तालिका बनाई है, लेकिन यह वास्तव में वही है।
मेरे द्वारा बनाया गया स्रोत डेटा है:
CREATE TABLE `table` (
`start` INT(11) NOT NULL,
`end` INT(11) NOT NULL,
`type` VARCHAR(6));
INSERT INTO `table` VALUES
(1,3,'A'),
(5,7,'A'),
(6,10,'A'),
(2,6,'B'),
(3,4,'B'),
(5,11,'B'),
(12,13,'B');
फिर अपना उत्तर प्राप्त करने के लिए आपको जिस स्क्रिप्ट का उपयोग करना होगा वह है:
DROP TABLE IF EXISTS temp;
CREATE TABLE temp (
id int(100) AUTO_INCREMENT,
start int(11) NOT NULL,
type VARCHAR(6),
PRIMARY KEY id (id));
INSERT INTO temp(start, type)
SELECT start, type FROM table
ORDER BY type, start;
SELECT t1.type, AVG(t1.start - t2.start) AS avg_gap
FROM temp t1
JOIN temp t2 ON t1.type = t2.type AND t1.id = (t2.id + 1)
WHERE t1.start - t2.start < 5
GROUP BY t1.type;
और परिणाम यह है:
type avg_gap
A 2.5
B 1.5
संपादित करें: संपादन में आपके नए नियम के अनुसार:मेरा नियम 5 से बड़े अंतराल की गणना करना नहीं है (जैसा कि आप WHERE
में देख सकते हैं। अंतिम क्वेरी का खंड)। इसलिए टाइप बी के आखिरी गैप को नजरअंदाज कर दिया गया।